DeepSeek y otros avances de la IA china mientras Trump trata de mantener a EEUU en cabeza a base de decretos

Tecnológicas como DeepSeek, ByteDance o Moonshot AI muestran sus últimos avances en modelos de lenguaje e inteligencia artificial

La china DeepSeek, la IA de código abierto que desafía la hegemonía estadounidense

Nvidia pierde 600.000 millones de dólares, la mayor caída diaria en historia de la bolsa

La primera semana de Donald Trump de vuelta en la Casa Blanca ha dejado decenas de titulares que abarcan casi todos los ámbitos (económico, político, social) y que se extienden mucho más allá de las fronteras de Estados Unidos.

En estos primeros siete días, el republicano ha firmado una gruesa pila de órdenes ejecutivas o decretos y ha gastado un buen número de rotuladores negros (como ya hizo en su primer mandato, sigue gustándole firmar con rotulador, para que se vea bien su firma en las fotos y también como metáfora del trazo grueso de muchas de esas medidas).

Trump ya dejó claro durante la campaña electoral que uno de los pilares de su segundo mandato sería la tecnología. Algo que iba más allá del omnipresente Elon Musk y que se pudo comprobar en la pléyade de multimillonarios tecnológicos que acudieron a su toma de posesión (Jeff Bezos de Amazon, Sundar Pichai de Google, Mark Zuckerberg de Meta o Tim Cook de Apple, además de Sam Altman de OpenAI o Shou Zi de Tik Tok).

De entre los centenares de órdenes ejecutivas que el nuevo/viejo presidente de EEUU ha firmado estos días hay unas cuantas centradas en inteligencia artificial o criptomonedas, por poner solo unos ejemplos.

Mark Zuckerberg (Meta), Jeff Bezos (Amazon), Sundar Pichai (Google) y Elon Musk (X) en la toma de posesión de Donald Trump. / Chip Somodevilla, EFE

El pasado martes anunció, acompañado de los directivos de OpenAI, SoftBank y Oracle, una inversión de hasta 500.000 millones de dólares en el sector privado para construir una infraestructura de IA en el país, un proyecto que lleva el nombre de Stargate.

Además, el jueves firmó dos nuevas órdenes ejecutivas para seguir desmantelando el legado de su predecesor Joe Biden y deshacerse de la "peligrosa" regulación sobre IA y criptomonedas que, sostiene, ha lastrado durante estos últimos cuatro años la innovación de Estados Unidos en ambos campos.

Larry Ellison (Oracle), Masayoshi Son (SoftBank) y Sam Altman (OpenAI), con Donald Trump en el anuncio del plan sobre IA. / AARON SCHWARTZ , EFE

La IA china da pasos de gigante y amenaza la hegemonía de EEUU

Mientras todo esto ocurría, al otro lado del Pacífico algunas de las principales tecnológicas chinas daban a conocer sus últimos avances en inteligencia artificial.

Empresas como DeepSeek, ByteDance o Moonshot AI han presentado estos días actualizaciones de sus modelos de IA generativa, destacando sus avances en tareas complejas como matemáticas y programación.

Según datos de los expertos, en el mercado chino se han registrado más de 200 modelos de lenguaje de gran tamaño (LLM), entre ellos algunos desarrollados por gigantes tecnológicos como el Jiutian de China Mobile, Wenxin Yiyan de Baidu, Tongyi Qianwen de Alibaba, Pangu de Huawei Cloud, Andes de Oppo y Lanxin de Vivo.

La verdadera amenaza se llama DeepSeek

Pero una de estas propuestas destaca especialmente no solo por sus avances tecnológicos sino por su impacto para las principales compañías estadounidenses del sector: DeepSeek.

El lanzamiento hace unos días de su último modelo, DeepSeek-R1, ha hecho temblar el Nasdaq en general (el mercado estadounidense en el que cotizan las tecnológicas) y en concreto a algunos de sus tótems. La aplicación, disponible en todo el mundo, se ha situado en lo más alto de las listas de descargas, incluso por encima de la hasta ahora intocable ChatGPT.

Apuesta por un modelo de código abierto, su plan gratuito ofrece mucho más que algunas apps de IA de la competencia y su plan de pago, que da acceso a una amplia lista de posibilidades para usuarios profesionales y empresas, es mucho más barato que el de otros competidores. Eso sí, para utilizarlo, incluso a través de navegador y no de aplicación, es necesario registrarse, algo que no ocurre por ejemplo con ChatGPT.

Por cierto que este lunes informan en su página de estatus que están sufriendo un ataque malicioso a gran escala que dificulta el uso de algunas funcionalidades y especialmente los nuevos registros de usuarios.

Otra ventaja, y no menor, de DeepSeek con respecto a OpenAI (ChatGPT), Anthropic (Claude) o Google (Gemini), por citar solo algunos, es que es más eficiente en términos energéticos y más barato en términos de infraestructura.

No necesita tanta potencia gráfica y, de hecho, su último modelo está desarrollado con productos de Nvidia bastante asequibles. Sí, Nvidia, una de las compañías más valiosas del mundo, es otra de las que no ha arrancado bien la semana (llegaba a perder más de un 13% en la apertura de la sesión este lunes).

En uno de esos giros curiosos del tipo hacer de la necesidad virtud, la prohibición de EEUU de exportar chips de última generación a China ha forzado a las empresas del país a conformarse con los menos potentes y exprimirlos al máximo, llevando a este abaratamiento de costes.

El coste de la IA empieza a ser una partida importante (quizás demasiado) en las cuentas de las grandes tecnológicas, que precisamente esta semana presentan resultados del cierre de 2024.

¿Qué es DeepSeek-R1 y qué puede hacer?

Lo último de DeepSeek es su primera generación de "modelos de razonamiento", DeepSeek-R1, entrenado mediante aprendizaje por refuerzo (RL) a gran escala sin ajuste fino supervisado (SFT) como paso preliminar.

La empresa asegura que DeepSeek-R1 es comparable con el o1 de OpenAI, en tareas como la resolución de problemas matemáticos, la programación y la inferencia del lenguaje natural.

Según DeepSeek, el modelo demuestra notables capacidades de razonamiento y gracias a ese aprendizaje por refuerzo es capaz de ofrecer de forma natural potentes "e intrigantes comportamientos de razonamiento".

Si el diálogo hablado similar al humano es una de las claves en la investigación en IA, otra es el razonamiento: que los modelos sean capaces de aprender y pensar (como hacemos los humanos) antes de resolver una petición.

Un aspecto en el que OpenAI, Google o Anthropic están trabajando, para que sus modelos de IA piensen más antes de responder.

La respuesta de OpenAI fue o1, presentado el pasado diciembre, pero DeepSeek-R1, de acuerdo al informe que compara el rendimiento de ambos modelos, no tiene nada que envidiarle. Y, además, a un coste significativamente menor que la propuesta del creador de ChatGPT (que, por cierto, ya ha lanzado su o3, aunque no disponible de forma amplia aún).

Eso sí, R1 no está del todo libre del control y supervisión de las autoridades chinas, con todo lo que ello conlleva.

Doubao, el modelo de voz en tiempo real de ByteDance

Por su parte, otro gigante de la tecnología china, ByteDance, desarrolladora de Tik Tok, estrenó su modelo de voz en tiempo real, Doubao.

Este modelo integrado de comprensión y generación de voz realiza diálogos de voz de extremo a extremo que según sus responsables ofrece un mejor nivel de expresión y control del habla, capacidad de aceptación emocional y un retardo muy bajo, con un tono y voz más naturales y un rango más amplio de expresiones emocionales.

El diálogo hablado similar al humano, que ofrece experiencia interactiva y conexión emocional, es uno de los objetivos clave en la búsqueda de la AGI (inteligencia artificial general).

El equipo de Doubao trabaja en una comprensión de las emociones del usuario y de información paralingüística en el habla, con el ambicioso objetivo de redefinir la futura interacción entre humano y ordenador infundiendo alma a la IA (aunque ellos mismos reconocen que estamos todavía lejos del Jarvis de Iron Man o de la Samantha de Her).

La expresividad, comprensión y aceptación emocionales y la expresión del habla similar a la humana han sido algunas de las metas que se marcaron, y por ahora han logrado que el modelo identifique si un usuario está triste, animado o bromeando, para responderle con el tono y estilos que correspondan a esos estados de ánimo.

El control por voz, la interpretación de roles (posee una gran capacidad narrativa al aprender las características vocales y emocionales de los distintos papeles) e incluso el canto son otros de los aspectos que han desarrollado y, por ahora, sostienen, han logrado una herramienta con un gran control emocional y una expresividad comparables a los de los actores profesionales (puede realizar delicados ajustes del timbre).

Moonshot AI y Tencent

Moonshot AI es otra de las firmas chinas que han anunciado estos días novedades. En concreto, un nuevo modelo, Kimi K1.5, que según la compañía es capaz de ofrecer un desempeño similar al del o1 de OpenAI en matemáticas, programación y razonamiento multimodal.

A la carrera de la IA se ha sumado además el gigante tecnológico Tencent, con un modelo de código abierto, Hunyuan3D 2.0, diseñado para convertir imágenes 2D en imágenes 3D, con aplicaciones previstas en el desarrollo de videojuegos, la publicidad en comercio electrónico y la manufactura industrial.

La normativa china para regular la IA

China aprobó en julio de 2023 una normativa provisional para regular los servicios de inteligencia artificial generativa similares a ChatGPT, que estarán sujetos a "los reglamentos vigentes en materia de seguridad de la información, protección de datos personales, propiedad intelectual y progreso científico y tecnológico".

Además, deberán respetar "los valores socialistas fundamentales", la "moral social y la ética profesional" y tendrán prohibido "generar contenidos que atenten contra la seguridad nacional, la unidad territorial, la estabilidad social o los derechos e intereses legítimos de otras personas".

Nada nuevo ni sorprendente en el país asiático, pero toda esta letra pequeña podría mermar las opciones de los desarrollos chinos para competir con Estados Unidos, sobre todo ahora que Donald Trump ha prometido básicamente eliminar todo lo que pueda restringir su innovación.

OpenAI y Perplexity también presentaron novedades esta semana

Este salto de la IA china no implica que las tecnológicas de EEUU se hayan quedado cruzadas de brazos. Mientras se iban conociendo los avances del gigante asiático, también OpenAI o Perplexity anunciaban novedades:

Operator, de OpenAI: Combina las capacidades del modelo GPT-4o con un razonamiento avanzado a través del aprendizaje. Es un agente de inteligencia artificial que razona, aprende y puede interactuar con lo que muestra una pantalla para navegar por internet y ejecutar tareas de forma autónoma, como lo haría una persona. Ya hay disponible una versión preliminar que pueden probar los usuarios del plan de pago Pro en Estados Unidos.
Perplexity Assistant: Un agente que se puede usar como sustituto del Asistente de Google en el teléfono y que, según la compañía, utiliza el razonamiento, la búsqueda y las aplicaciones para ayudar con tareas cotidianas. Puede realizar "acciones multiaplicación", como llamar a un taxi o buscar una canción. Tiene acceso a internet, es multimodal, mantiene el contexto y se integra con otras aplicaciones para ejecutar tareas combinadas.