Los antiguos investigadores de Meta que desarrollaron un modelo lingüístico de inteligencia artificial para ayudar a la ciencia (y cuyo proyecto cerró Zuckerberg) han lanzado una nueva startup y han recaudado al menos 40 millones de dólares, según ha podido saber Forbes.
EvolutionaryScale está dirigida por Alexander Rives, que dirigió el equipo de plegamiento de proteínas de Meta AI hasta que el gigante tecnológico cerró el proyecto en abril. Los ocho miembros del equipo fundador proceden todos de la misma unidad, donde crearon un modelo basado en chats de IA en la línea de GPT-4 de OpenAI o Bard de Google, pero entrenado con datos sobre moléculas de proteínas para predecir las estructuras de otras proteínas desconocidas. Lo utilizaron para crear una base de datos que hoy contiene 700 millones de posibles estructuras tridimensionales, piezas clave del rompecabezas para desarrollar fármacos que podrían curar enfermedades, microorganismos que podrían limpiar la contaminación o formas alternativas de fabricar productos químicos industriales.
En junio, la empresa se dirigió a los inversores de capital riesgo en busca de financiación inicial para avanzar en sus esfuerzos de investigación aumentando drásticamente el tamaño de su modelo de IA, según un documento de presentación obtenido por Forbes. Lux Capital lideró la ronda de aproximadamente 40 millones de dólares, según cuatro personas con conocimiento de la operación. Dos fuentes dijeron que la financiación valoraba EvolutionaryScale en 200 millones de dólares y que destacados inversores en IA, Nat Friedman y Daniel Gross, participaron en ella.
Las proteínas son grandes moléculas formadas por cadenas plegadas de aminoácidos y son los componentes básicos de bacterias, microbios y células humanas. Sus funciones específicas suelen estar dictadas por su forma y esa forma puede cambiar cuando interactúa con otras sustancias químicas o proteínas del organismo. En consecuencia, las partes específicas de una proteína suelen ser los objetivos de los fármacos para tratar enfermedades. Pero predecir la forma de una proteína es complicado, porque se rige por complicadas interacciones entre los miles de átomos que la componen (por ejemplo, el pelo rizado está causado por la interacción de los átomos de azufre contenidos en un aminoácido concreto).
Estas predicciones son cruciales para permitir a los científicos averiguar las funciones de las proteínas con el fin de diseñar un fármaco que se una adecuadamente a su estructura tridimensional. La capacidad de trazar la estructura de tantas proteínas, por tanto, ayuda a los científicos a acotar sus pistas sobre cuáles merece la pena dedicar recursos a atacar.
DeepMind, filial de Google, dio el gran salto en este campo en 2020 con la publicación de código abierto de AlphaFold, su sistema de inteligencia artificial para predecir las estructuras de las proteínas. El premio Nobel Venki Ramakrishnan elogió el trabajo de DeepMind como un «avance asombroso» que «cambiaría fundamentalmente la investigación biológica» en una entrada del blog de la empresa publicada en 2020″. Incluso ser capaz de predecir la estructura de los 200 millones de proteínas deja un enorme reto a los científicos para determinar cómo interactuarían los fármacos con estas moléculas. Esa investigación se publicó posteriormente en Nature y le valió al director general de DeepMind, Demis Hassabis, y al investigador principal, John Jumper, un premio Breakthrough de 3 millones de dólares.
El pasado mes de noviembre, el grupo dirigido por Rives pregonó su modelo en un artículo publicado por la revista Science diciendo que era capaz de hacer predicciones 60 veces más rápido que AlphaFold, aunque las predicciones son menos precisas de media. Hasta la fecha, la IA ha proporcionado en gran medida meras mejoras incrementales en la eficacia del desarrollo de fármacos. El momento eureka de la IA generativa basada en texto –en el que las capacidades técnicas mejoraron tan repentina y bruscamente que desencadenaron un boom comercial– aún no se ha producido en biología, y algunas empresas farmacéuticas tradicionales no están convencidas de que vaya a producirse nunca.
En abril, con la carrera impulsada por ChatGPT para comercializar la IA generativa en pleno apogeo, el equipo de Rives abandonó Meta. Aunque el gigante tecnológico creó su rama de IA para llevar a cabo una amplia gama de investigaciones, su enfoque se ha ido reduciendo a medida que ciertos proyectos mostraban viabilidad comercial; de forma similar, OpenAI disolvió su equipo de robótica en 2021. El Financial Times, que informó por primera vez de la desaparición del equipo de proteínas, lo describió como parte de despidos más amplios y de un cambio de estrategia en la nave nodriza para centrarse en esfuerzos comerciales, como una serie de chatbots de IA. La IA para la biología tiene pocas perspectivas de proporcionar rendimientos comerciales lucrativos a corto plazo. Actores comerciales como Schrodinger, que actualmente cotiza en bolsa con una capitalización inferior a los 3.000 millones de dólares, venden productos basados en métodos de modelado molecular de la vieja escuela.
EvolutionaryScale es la última empresa que ha obtenido capital para la investigación de IA basada en transformadores a unas valoraciones descomunales. Entre las empresas unicornio de desarrollo de modelos se encuentran Inflection AI, que recaudó 1.300 millones de dólares en junio; Cohere, que anunció 270 millones de dólares en mayo; y Adept, que cerró una inversión de 350 millones de dólares en marzo. Esta semana, Hugging Face, un proveedor de infraestructuras de IA muy prometedor, anunció una inyección de 235 millones de dólares con una valoración de 4.500 millones (Forbes fue el primero en informar el mes pasado de que la empresa estaba recaudando fondos). Muchos de los acuerdos representan apuestas a que los ingresos insignificantes acabarán repuntando. Stability AI, que recaudó 100 millones de dólares a una valoración de 1.000 millones el año pasado, está luchando por generar ingresos, entre otros retos, como informó Forbes en una investigación de junio.
Otros avances técnicos en la IA de plegamiento de proteínas también requerirán una inversión sustancial. DeepMind creó una nueva rama de descubrimiento de fármacos, Isomorphic Labs, en diciembre de 2022, mientras que sus rivales Insitro y Recursion, que cotiza en el NASDAQ, han recaudado más de 1.000 millones de dólares de inversores privados y públicos (en el documento de presentación, EvolutionaryScale describió a estas empresas como «socios potenciales» a los que podría ayudar a habilitar a través de sus modelos). Incluso con esa inversión, el tiempo medio para llevar un medicamento desde su descubrimiento hasta su aprobación por la FDA es de unos 7-10 años.
El equipo de Rives parece darse cuenta de su condición de «moonshot». EvolutionaryScale proyecta que gastará 38 millones de dólares en su primer año, de los que 16 millones se destinarán a potencia informática, según el documento de presentación. Los costes se multiplican a partir de ahí, hasta 161 millones de dólares en el segundo año y 278 millones de dólares en el tercero (con 100 y 200 millones de dólares gastados en computación, respectivamente). Pero a lo largo del documento, la empresa subraya repetidamente que podrían pasar diez años hasta que los modelos de IA biológica ayuden a diseñar productos y terapias.
Es decir, si su hipótesis es correcta en primer lugar. El presupuesto de computación intensiva (y el nombre de la empresa) aluden a la gran apuesta de EvolutionaryScale: escalar el modelo de IA –alimentándolo con más datos y aumentando su tamaño– producirá un «avance de capacidad en la IA para la biología», afirma el memorándum de lanzamiento, comparando el estado actual con el del procesamiento del lenguaje natural en 2018. «Actualmente no vemos ningún otro esfuerzo creíble centrado en la hipótesis del escalado en biología», afirma el documento.
EvolutionaryScale pretende construir un nuevo modelo cada año, según la nota. Para el tercer año, su ambición es ir más allá de la mera predicción de estructuras proteínicas para integrar otros datos biológicos de secuencias de ADN, expresión génica y estados epigenéticos. Su visión a largo plazo implica vender un modelo de IA de propósito general para la biología que no sea específico para ningún caso de uso. El modelo, teoriza, podría utilizarse para la medicina –como el desarrollo de «células programables que busquen y destruyan el cáncer u otras enfermedades»– pero también otras aplicaciones biotecnológicas como el diseño de «máquinas moleculares» para limpiar residuos tóxicos o capturar carbono (pero este es otro mercado desafiante: una idea así refleja la tesis de Ginkgo Bioworks, que actualmente cotiza en bolsa un 84% por debajo del precio de sus acciones en la OPV).
Para conseguirlo, EvolutionaryScale debe demostrar su ventaja sobre AlphaFold, que sigue siendo gigante del sector. Otras empresas están surgiendo para abordar objetivos similares, como Inceptive, que pretende aplicar grandes modelos lingüísticos para diseñar terapias farmacológicas basadas en el ARN. La startup fue cofundada por Jakob Uszkoreit, coautor del histórico trabajo de investigación que inventó el transformador, el avance técnico que está detrás del frenesí actual de financiación de la IA generativa. Un inversor en biotecnología que habló con Forbes de forma anónima especuló con la posibilidad de que las futuras versiones de modelos de lenguaje amplio más generalizados, como la serie GPT de OpenAI, lleguen a ser lo suficientemente hábiles como para aplicarse a la biología.
Es probable que estas batallas competitivas no sean una preocupación a tiempo completo para Rives, que se describe en el documento como «consejero delegado interino». Según el documento de presentación, tiene una oferta para unirse al profesorado del MIT y del Instituto Broad de Harvard el año que viene y crear un «laboratorio de diseño biológico».