Forbes Funds

¿Puede DeepSeek revolucionar la IA con solo 6 millones de dólares?

Como bien dice Ray Dalio, “No hay nada más peligroso que asumir que lo que funciona hoy seguirá funcionando mañana”. Y esta semana, Silicon Valley ha tenido una lección magistral al respecto. Nvidia, la estrella indiscutible de la revolución tecnológica, perdió casi un 17% de su valor en una sola jornada, borrando de un plumazo 593.000 millones de dólares (más de 568 millones de euros) de su capitalización. Es, literalmente, la mayor pérdida en un solo día registrada para una empresa en la historia de los mercados. Pero Nvidia no cayó sola; el Nasdaq se desplomó más de un 3%. Y todo esto, por una empresa de la que nadie había oído hablar hasta ahora.

La startup china DeepSeek ha aparecido de la nada con su modelo de inteligencia artificial (IA), el R1, y su anuncio ha caído como una bomba en el mercado. ¿Qué tiene de especial? Lo llamativo no es solo que su tecnología haya alcanzado una capacidad cognitiva comparable al modelo O1 de ChatGPT (uno de los más avanzados hasta ahora), sino cómo lo ha hecho. Según DeepSeek, entrenar el modelo R1 cuesta apenas 6 millones de dólares. En comparación, entrenar modelos como el O3 de ChatGPT requiere inversiones que rondan los 100 millones de dólares.

Y ahí no queda la cosa. Cada consulta al sistema de DeepSeek costaría hasta un 93% menos que en las plataformas actuales de la competencia. Para entendernos, mientras una tarea compleja en el O3 de ChatGPT puede costar alrededor de 1.000 dólares, el R1 de DeepSeek logra resultados similares por una fracción de ese precio.

¿Es esto el principio del fin para la hegemonía de Silicon Valley?

Si un modelo de IA puede igualar o superar las capacidades actuales con una fracción de los recursos, las implicaciones son gigantescas. Esto, podría tener un impacto negativo en las empresas que suministran esos recursos, como Nvidia, que vende GPUs (Graphic Processing Units o unidades de procesamiento gráfico), o las compañías energéticas que abastecen de electricidad a los centros de datos.

Básicamente, los desarrolladores de IA ya no necesitarían comprar tantas GPUs ni consumir tanta energía para entrenar y operar sus modelos. El gestor de fondos de capital riesgo Marc Andreessen lo ha descrito como el “momento Sputnik” de la IA, en referencia al impacto que tuvo el primer satélite soviético en la carrera espacial.

¿Cómo ha sido posible?

La respuesta está en la necesidad. Las restricciones del gobierno de Joe Biden, diseñadas para frenar el desarrollo de la inteligencia artificial en China al limitar la exportación de semiconductores avanzados, han forzado a la economía china a buscar alternativas ingeniosas. Sin acceso al menos oficialmente a los chips más sofisticados, han tenido que desarrollar métodos más eficientes para alcanzar resultados similares a los modelos avanzados de IA en Estados Unidos, pero utilizando muchos menos recursos. Paradójicamente, las medidas estadounidenses han terminado siendo un tiro en el pie.

¿De verdad ha costado solo 6 millones de dólares DeepSeek?

El coste de desarrollar el R1 de DeepSeek, esos tan comentados “6 millones de dólares”, ha sido repetido una y otra vez, pero no está del todo claro si hay que tomárselo al pie de la letra. Hay varios motivos para dudar. Por un lado, DeepSeek ha podido apoyarse en años de investigación previa financiada tanto por el sector público como por iniciativas privadas. Esos costes no aparecen reflejados en los famosos «6 millones de dólares», pero sin ellos probablemente el modelo no sería lo que es hoy.

Por otro lado, está el tema de los semiconductores. Desde que Estados Unidos limitó la exportación de chips avanzados a China, las empresas tecnológicas chinas han tenido que buscar alternativas. Sin embargo, ¿es posible que DeepSeek haya conseguido más GPUs de las que dice? ¿Tal vez burlando las restricciones? Si eso fuera cierto, su eficiencia real sería mucho menor de lo que aseguran.

Y luego está la cuestión del aprendizaje. Algunos expertos creen que DeepSeek ha destilado el modelo O1 de ChatGPT, como si hubiera aprendido a hacer lo mismo, pero de una manera mucho más sencilla. Si este fuera el caso, su innovación depende en gran medida del trabajo previo de OpenAI, y no sería tan independiente como parece. Aunque, claro, esto no quita mérito a la capacidad de DeepSeek para mejorar lo que ya existe.

Por último, el modelo abierto de DeepSeek presenta otros interrogantes. Los analistas advierten que, al estar diseñado para seguir las leyes y valores de China, podría introducir sesgos que limiten su adopción en Occidente.

Aunque el impacto inicial de DeepSeek ha sido significativo, algunos analistas creen que las preocupaciones están sobredimensionadas. Citi, por ejemplo, señala que el modelo de DeepSeek aún depende de infraestructura tecnológica existente, lo que implica que los grandes jugadores de la industria seguirán siendo relevantes.

Uno de ellos, OpenAI ya ha roto su silencio. En un hilo en la red social X, el CEO de la compañía dueña de ChatGPT, Sam Altman, ha asegurado que el modelo R1 de su rival es «impresionante, especialmente si se tiene en cuenta lo que puede ofrecer por el precio». Otro de los implicados, Jensen Huang, CEO de Nvidia, ha señalado por su parte que: “en tecnología, no hay terreno sólido. Lo que parece seguro hoy puede desaparecer mañana”.

Si realmente DeepSeek puede hacer todo esto con solo “6 millones de dólares”, ¿qué podría lograr con más recursos? Silicon Valley y los inversores se encuentran estos días a la defensiva, cuestionándose si sus estrategias multimillonarias siguen siendo sostenibles.

El golpe que ha recibido Nvidia y, por extensión, toda la industria tecnológica, no es un simple tropezón. Es un aviso. Uno que nos recuerda que, en el terreno de la tecnología, el éxito en el pasado no garantiza el futuro, y cualquier ventaja puede desvanecerse en un abrir y cerrar de ojos.

Artículos relacionados