Inflection AI, la startup que está detrás del chatbot conversacional Pi, ha presentado un nuevo modelo de inteligencia artificial (IA) que, según la empresa, supera a dos alternativas populares desarrolladas por Google y Meta, y le pisa los talones al modelo GPT-4, el buque insignia de OpenAI.
Denominado Inflection-2, el modelo ha obtenido mejores resultados que el modelo PaLM Large 2 de Google, anunciado en mayo, en una serie de pruebas de referencia estándar, según Inflection, al tiempo que ha superado al modelo de código abierto LLaMA 2, desarrollado en gran medida por Meta, en diferentes mediciones. En conjunto, el modelo de Inflection es el de mayor rendimiento de su tamaño, según la empresa. Sólo le va a la zaga GPT-4, el modelo insignia de OpenAI, que se cree que es mucho mayor.
«Creemos que estamos justo al principio de esta curva de escalado, y las nuevas capacidades que van a surgir son realmente alucinantes», declaró en una entrevista Mustafa Suleyman, consejero delegado de Inflection AI.
El nuevo modelo se integrará pronto en Pi, el chatbot que Inflection lanzó en mayo. Primero necesita un poco más de trabajo adicional conocido como «alineación» para enseñarle el tono y el estilo de respuesta de Pi, y para ayudar a Pi a funcionar mejor mientras absorbe información actualizada sin alucinaciones adicionales, dijo Suleyman.
«Tanto si quieres mantener una conversación delicada sobre raza, género, política, OpenAI o cualquier otro tema polémico del momento, Pi se compromete contigo de forma sutil y cuidadosa, con acceso a la información en tiempo real», ha afirmado. Pi se actualizará con el nuevo modelo «muy pronto, no tardará mucho», añadió Suleyman, aunque declinó facilitar una fecha.
No quiso facilitar cifras actualizadas de usuarios de Pi, pero dijo que «es masivamente popular, con una enorme retención». Hace dos semanas, OpenAI reveló que su servicio gratuito ChatGPT había alcanzado los 100 millones de usuarios semanales, justo antes del sorprendente despido temporal del consejero delegado Sam Altman el viernes.
Resulta difícil no considerar el lanzamiento del gran modelo lingüístico de Inflection, calificado como «el segundo LLM más capaz del mundo en la actualidad», en el contexto de la agitación del fabricante de modelos más conocido del sector. El miércoles por la mañana, OpenAI anunció que Altman volvía como consejero delegado de OpenAI, tras un fin de semana en el que los aliados negociaron el regreso de Altman y los empleados de OpenAI firmaron una petición para que su junta directiva dimitiera en masa.
En Inflection, Suleyman insistió en que su startup, que obtuvo una ronda de financiación de 1.300 millones de dólares a principios de año, no había adelantado la fecha de lanzamiento del nuevo modelo de Inflection, a pesar de que anteriores declaraciones públicas parecían sugerir un lanzamiento a finales de año. En realidad, el lanzamiento se retrasó una semana, afirmó, ya que la formación finalizó la semana pasada.
Para entrenar a Inflection-2, la startup utilizó 5.000 unidades de procesamiento gráfico (GPU) Nvidia H100, frente a los varios miles de antiguas A100 que entrenaron a su predecesor. El nuevo modelo, que según Suleyman es más rápido y barato de entrenar, sigue manejando una enorme cantidad de operaciones (10^25 FLOPs, u operaciones en coma flotante). Inflection colabora estrechamente con Microsoft, Nvidia y CoreWeave para gestionar su clúster informático.
Inflection puso a prueba su nuevo modelo en una popular prueba comparativa de tareas de nivel escolar y profesional conocida como MMLU, en la que se plantean a los modelos preguntas sobre 57 temas, desde el conocimiento del mundo hasta la resolución de problemas y la ética.
Según Suleyman, Inflection-2 superó a la versión más grande de LLaMA 2, con 70.000 millones de parámetros, a Grok-1 de la startup xAI de Elon Musk, a PaLM 2 Large de Google y a Claude 2 de la startup Anthropic, quedando solo por detrás de GPT-4. Según Inflection, el nuevo modelo superó a los modelos LLaMA 2 y PaLM 2 en todas menos en dos de las siete pruebas de respuesta científica; también obtuvo los mejores resultados en dos de las tres pruebas de tarea de preguntas y respuestas, perdiendo en una frente a PaLM 2 Large. En cuatro pruebas de matemáticas y código, obtuvo unos resultados respetables a pesar de que no se centraban explícitamente en esas áreas, añadió la empresa; sin embargo, quedó muy por detrás de GPT-4 en las dos en las que OpenAI ha compartido resultados.
Aunque estas pruebas no parezcan significativas para nadie, salvo para un investigador o desarrollador de IA, las pequeñas mejoras pueden marcar la diferencia entre un «prototipo chapucero» y un modelo «de producción, fiable y de alta calidad», afirma Suleyman. En general, Suleyman afirma que Inflection-2 puede considerarse el mejor de su clase por su tamaño, «muy, muy cerca» de GPT-4. A partir de hoy, Inflection se centrará en la formación de su próximo modelo, que, según sus previsiones, multiplicará por diez la escala de su predecesor en seis meses, y por diez en otros seis meses. (Cien veces más grande que ahora, para los que llevan la cuenta).
Hablando horas antes de que la desordenada batalla de la junta directiva de OpenAI alcanzara una resolución provisional, Suleyman instó al público a acercarse a los implicados «con empatía y perdón». «Hay mucha gente muy bienintencionada», señaló, apuntando en particular al cofundador Ilya Sutskever, originalmente uno de los directores de la junta que despidió a Altman, y que anunció que se arrepentía de esa decisión el domingo por la noche. (No quedó claro de inmediato si Sutskever seguiría en OpenAI, pero le gustaron los posts de la empresa y de Altman anunciando el regreso en X).
Sutskever trabajó para Suleyman ya en 2011 como contratista y consultor en DeepMind, la startup de IA que vendió a Google tres años después. «Siento un gran respeto por él, no solo técnicamente, sino también por sus principios y su sinceridad. Supongo que él y el resto del equipo tienen muy buenas intenciones», afirma Suleyman.
Inflection y Suleyman ya han hablado abiertamente de la seguridad de la IA, y en julio firmaron, entre otras medidas, la orden voluntaria del Presidente Biden. También se ha comprometido a evitar que Pi responda a preguntas relacionadas con elecciones o participe en la creación de materiales para campañas políticas. Suleyman publicó recientemente un libro que detalla en parte los riesgos de la IA, titulado The Coming Wave.
«Obviamente ha habido algunos errores muy, muy importantes», dijo sobre la junta de OpenAI y las acciones de su inusual junta sin ánimo de lucro, que había sido difamada por algunos en la industria de la tecnología en los últimos días. «Espero que la gente intente ser indulgente y vea esto como un pequeño bache en el viaje general para intentar construir mejores empresas que hagan lo correcto e intenten hacer del mundo un lugar mejor con nuevas estructuras de gobierno».
Dicho esto, Suleyman también es un capitalista: preguntado por si el tropiezo de OpenAI –ChatGPT estuvo caído al menos durante parte del lunes y el martes, mientras los clientes observaban los procedimientos con preocupación– daba más oportunidades a los rivales, el CEO de Inflection no discrepó.
«Fundamentalmente, estoy construyendo un negocio», afirma Suleyman. «Y es extremadamente competitivo. Es el momento más competitivo y creativo de Silicon Valley en años«.
*Reportaje de Alex Konrad