Así es DeepSeek, el rival chino de ChatGPT que causa sensación en Silicon Valley

DeepSeek, el rival de ChatGPT desarrollado por el magnate de fondos de cobertura chino Liang Wenfeng, encabezó las listas de descargas y comenzó un debate sobre cómo una empresa relativamente oscura logró crear productos de inteligencia artificial avanzados, a pesar de los controles de exportación de Washington sobre tecnologías relacionadas. Según Sensor Tower, una plataforma de inteligencia de mercado con sede en San Francisco, DeepSeek-AI Assistant, que funciona con un modelo de inteligencia artificial patentado, es actualmente la aplicación gratuita más popular en la App Store de Apple, tanto en China como en Estados Unidos. De manera similar a ChatGPT, el chatbot puede realizar tareas como responder preguntas, redactar contenido y ayudar a los usuarios a recopilar información.

El aumento de popularidad de la aplicación se produce en un momento en que DeepSeek, la empresa con sede en Hangzhou que la creó, ha cautivado a Silicon Valley con sus avances tecnológicos. Parece haber desarrollado una IA avanzada a una fracción del costo que gastó OpenAI, con sede en San Francisco, y al mismo tiempo utilizando chips menos potentes, desde que las autoridades estadounidenses impusieron restricciones a la venta de semiconductores a China. El modelo DeepSeek R1, lanzado a principios de este mes, es ahora el cuarto modelo de IA más popular del mundo según la votación de los usuarios, según Chatbot Arena, una plataforma de evaluación desarrollada por investigadores tecnológicos, entre ellos de la Universidad de California, Berkeley. El producto se sitúa por delante del modelo OpenAI o1 lanzado en diciembre pasado, según Chatbot Arena.

Es capaz de realizar razonamientos complejos y resolver problemas matemáticos sofisticados, con un rendimiento que iguala al de OpenAI o1, afirmó DeepSeek cuando se lanzó el producto a principios de este mes. Liang se reunió con el primer ministro chino, Li Qiang, la semana pasada como parte de una reunión gubernamental para hablar sobre la IA.

La empresa no respondió a las solicitudes de más comentarios. Fundada en 2023 y sin financiación externa conocida, el éxito inicial de DeepSeek está impresionando profundamente a Silicon Valley. «DeepSeek R1 es uno de los avances más asombrosos e impresionantes que he visto y, como código abierto, un gran regalo para el mundo», escribió el inversor multimillonario Marc Andreessen en una publicación del 24 de enero en la plataforma de redes sociales X. Paul Triolo, socio de la firma de asesoría DGA-Albright Stonebridge Group con sede en Washington, DC, dice por correo electrónico que los modelos de DeepSeek se consideran entre los mejores, especialmente al comparar su desempeño con OpenAI.

El rápido ascenso de la empresa está impulsado por Liang Wenfeng, un magnate de fondos de cobertura solitario obsesionado con las tecnologías avanzadas. Liang nació en 1985 en Guangdong, donde su padre era maestro de escuela primaria. Liang comenzó su carrera como inversor, según informes de los medios locales. Después de recibir una maestría relacionada con la visión artificial de la Universidad de Zhejiang con sede en Hangzhou en 2008, Liang comenzó a investigar cómo usar la IA en la negociación de acciones.

Liang cofundó el fondo de cobertura High-Flyer Quant en 2015 y un año después estaba implementando sus algoritmos para evaluar oportunidades de inversión. En 2017, casi todas las inversiones de High-Flyer Quant se realizaron mediante inteligencia artificial, afirma la empresa en su sitio web.

En 2019, los activos bajo gestión de High-Flyer Quant habían ascendido a 10.000 millones de yuanes (1.400 millones de dólares). Algunos de sus fondos de mayor rendimiento tienen rendimientos superiores al 200% a partir de 2024, según datos de Hithink Flush Information de China citados por los medios locales.

Sin embargo, el verdadero interés de Liang parece ser explorar tecnologías de vanguardia. En una entrevista poco común de 2023, el empresario le dijo al medio local 36Kr que quiere investigar e innovar. Mientras dirigía High-Flyer Quant, Liang comenzó a acumular chips de Nvidia antes de que entraran en vigor los controles de exportación de Washington. También invirtió los rendimientos de su fondo de cobertura en el entrenamiento de modelos de IA.

En 2023 se fundó DeepSeek. Según Qichacha, un servicio de información empresarial, la startup sigue autofinanciada sin ningún inversor externo. La empresa lanzó su primer modelo de IA en noviembre de 2023.

Xu Huazhe, profesor adjunto de ciencias de la información en la prestigiosa Universidad Tsinghua de China, afirma a través de WeChat que algunas de las innovaciones de DeepSeek parecen provenir de una tecnología llamada mezcla de expertos (MoE, por sus siglas en inglés). Esta permite a los investigadores entrenar muchos modelos de IA más pequeños al mismo tiempo y combinar resultados seleccionados para responder a los usuarios. Según Xu, una técnica de este tipo no requiere tantos chips avanzados ni la recopilación de tantos datos, lo que significa que DeepSeek podría ahorrar costes. La empresa ha afirmado que algunos de sus modelos de IA solo han necesitado 5,6 millones de dólares para entrenarse, lo que supone hasta un 95% menos de lo que ha gastado OpenAI.

DeepSeek, a su vez, cobra menos a los usuarios. El chatbot con asistente de IA es gratuito, pero los desarrolladores de aplicaciones pagan para acceder al modelo subyacente, que pueden modificar para crear otros productos basados en él. DeepSeek R1 cobra 14 centavos por millón de tokens, que en IA se refiere a la cantidad de datos procesados, mientras que OpenAI cobra 7,50 dólares.

Shen Meng, director ejecutivo del banco de inversión Chanson& Co., con sede en Pekín, afirma a través de WeChat que DeepSeek ha trazado su propio camino tecnológico, mientras que la mayoría de los modelos chinos son imitaciones. Afirma que esto también ha generado esperanzas para los desarrolladores de chips de China.

“El entrenamiento de DeepSeek no depende de tanta potencia de procesamiento, lo que significa que no necesita tantas unidades de procesamiento gráfico (GPU, un tipo de chip de inteligencia artificial) de Nvidia”, afirma Shen. “Esto significa que los chips de China ahora tienen más margen de crecimiento”.

Etiquetado:

Así es DeepSeek, el rival chino de ChatGPT que causa sensación en Silicon Valley

La era del «ChatGPT para profesores» consolida la IA como aliada del docente en España

Conozca a los banqueros que alimentan el insaciable apetito de las grandes tecnológicas por las startups de IA

Los ‘dioses de la IA’ gastan todo lo que pueden en tokens de inteligencia artifical

Conozca la startup de 580 millones de dólares que crea modelos de IA para combatir a los ciberdelincuentes