Uno de los santos griales de la biología es la simulación digital de una célula viva. Si los investigadores pueden usar computadoras para comprender con mayor precisión cómo reaccionarían los nuevos medicamentos en el organismo, esto podría darles mayor confianza al probarlos en animales y humanos.
Pero si bien los modelos lingüísticos de gran tamaño han propiciado avances en el modelado del comportamiento de las proteínas, aplicar la misma tecnología para simular todas las complejidades de una célula completa no ha sido tan fructífero. Simplemente, no hay suficientes datos.
Pero en febrero de este año, una startup llamada Tahoe Therapeutics se acercó un paso más a ese objetivo con el lanzamiento de Tahoe-100M, una colección de 100 millones de puntos de datos diferentes que muestran cómo distintos tipos de células cancerosas respondieron a las interacciones con más de 1000 moléculas distintas. Este tipo de datos, llamados perturbaciones, es crucial para el entrenamiento de modelos de IA, ya que la información sobre cómo las células responden a diversas moléculas mejora la capacidad de un algoritmo para predecir cómo se verán afectadas por otras.
«Creemos que el Tahoe-100M fue un momento de aterrizaje en Marte para los conjuntos de datos de una sola célula», dijo a Forbes el director ejecutivo de Tahoe, Nima Alidoust, de 39 años .
La empresa pudo crear este conjunto de datos menos de tres años después de su fundación gracias a su plataforma Mosaic, que le permite tomar células de diversos tipos de pacientes, de todos los órganos, y luego combinarlas, en lugar de las técnicas convencionales, que analizan células de un solo individuo a la vez, explicó el director científico y cofundador, Johnny Yu. «Así, cada vez que realizamos un experimento, generamos enormes atlas de células individuales que muestran qué fármacos afectan a qué pacientes».
“Nuestra principal superpotencia es la capacidad de generar los enormes conjuntos de datos necesarios para los modelos celulares virtuales”, afirmó Alidoust. La capacidad de escalar rápidamente esa producción de datos, añadió, es el factor diferenciador de Tahoe en comparación con otras empresas que trabajan en IA para el descubrimiento de fármacos. También es fundamental para el objetivo de la empresa de crear modelos celulares virtuales y utilizarlos para encontrar nuevos tratamientos contra el cáncer y otras enfermedades.
Hoy, Tahoe anunció la obtención de 30 millones de dólares en financiación de capital de riesgo, liderada por Amplify Partners. Otros inversores incluyen Databricks Ventures, Wing Venture Capital, General Catalyst, AIX Ventures, Mubdala Ventures, Civilization Ventures y Conviction. Esta inversión eleva la financiación total de la empresa a 42 millones de dólares y su valoración a 120 millones de dólares.
Las malas predicciones de la IA han sido una fuente constante de frustración en el sector biotecnológico, afirmó Krish Ramadurai, socio de AIX Ventures y miembro del consejo de administración de Tahoe. «Estos algoritmos de IA no paran de recomendar cosas, y luego, cuando se prueban en el laboratorio, todo es un desastre», afirmó. Los datos que Tahoe puede generar, añadió, marcan una diferencia crucial en la precisión de los nuevos modelos.
Apenas unos meses después de que Tahoe publicara su conjunto de datos de 100 millones de puntos, la organización de investigación sin fines de lucro Arc Institute lanzó un modelo de celda virtual de código abierto, State , que utilizó Tahoe-100M como parte de sus datos de entrenamiento. Al realizar una evaluación comparativa, Arc descubrió que tiene el doble de precisión que otros modelos de IA y, además, superó a los programas de aprendizaje automático más sencillos que previamente habían superado con creces a otros modelos básicos.
Esto es un testimonio de casi una década de trabajo del cofundador de Tahoe, Yu, de 34 años, quien desarrolló la tecnología subyacente de Mosaic, mientras trabajaba en el laboratorio del profesor de bioquímica y biofísica Hani Goodarzi en la Universidad de California en San Francisco.
Alidoust conoció a Goodarzi, de 41 años, cuando eran compañeros de clase en Princeton. Se reencontraron en 2022 para hablar sobre la idea de fundar una empresa para crear modelos celulares virtuales. Goodarzi comentó que un componente esencial de dicha empresa sería la recopilación de datos a gran escala, por lo que contrató a Yu.
Un mes después, los tres cofundaron Tahoe (entonces llamada Vevo Therapuetics) junto con el investigador de la UCSF Kevin Shokat, de 60 años. La empresa recaudó una ronda inicial de 12 millones de dólares en diciembre de 2022. El nombre se cambió de Vevo a Tahoe en abril de este año después de una impugnación legal.
Con nuevo capital disponible, Tahoe se centra ahora en la creación de un conjunto de datos con más de mil millones de puntos de datos unicelulares para impulsar sus propios modelos celulares virtuales. Con sus propios modelos y datos patentados, la empresa está acelerando el desarrollo de nuevos medicamentos contra el cáncer. Alidoust afirmó que Tahoe cuenta actualmente con un fármaco candidato contra «un subtipo importante de cáncer», con el que está realizando los estudios requeridos por la FDA para iniciar las pruebas en humanos.
Además, Alidoust afirmó que, si bien la compañía pretende mantener la propiedad de sus conjuntos de datos más grandes, planea seleccionar una importante empresa farmacéutica o de inteligencia artificial para compartir datos. La idea sería colaborar en el desarrollo de nuevos medicamentos o en modelos de inteligencia artificial para el descubrimiento de nuevos fármacos, lo que daría a Tahoe «más oportunidades de obtener ingresos». Añadió que aún no se ha seleccionado a ese socio, pero que actualmente trabaja con diferentes empresas en proyectos más pequeños.
Mientras tanto, dijo, la compañía seguirá trabajando en la generación de más datos para sus modelos de IA y en la puesta a prueba de su tecnología. «En la compañía decimos que este es el momento ideal para la biología», dijo. «Estamos construyendo. Y esperamos que otros también lo hagan con nosotros».
