Opinión Eugenio Mallol

El español que busca antibióticos con IA en el ADN de los mamuts

El trabajo pionero de César de la Fuente en el ámbito de la biología nos dice muchas cosas del potencial de la inteligencia artificial para alumbrar espacios de la realidad hoy ocultos, siempre que le proporcionemos buenos datos para aprender a buscarlos.

César de la Fuente, director del Grupo de Biología de Máquinas de la Universidad de Pensilvania.

“Cuando propusimos usar inteligencia artificial (IA) y ordenadores para diseñar antibióticos, nos dijeron que era imposible, muy poca gente lo había intentado”, recuerda el coruñés César de la Fuente, director del Grupo de Biología de Máquinas de la Universidad de Pensilvania. Por entonces, hacia estudios de postdoctorado en el MIT. “El consenso era que la biología tenía demasiadas variables y que con algoritmos no se podía hacer mucho”.

Su equipo derribó esa barrera histórica y demostró experimentalmente que la IA puede descubrir potenciales antibióticos. Sintetizaron las fórmulas obtenidas usando métodos químicos y consiguieron reducir infecciones en ratones. Era la primera vez que algo diseñado por una máquina conseguía curar.

Resulta muy interesante la historia de César de la Fuente y su experiencia con los algoritmos, más allá del hecho espectacular de que haya ‘extraído’ algunas de las moléculas rastreando con IA el genoma de animales ya extinguidos como los mamuts, los elefantes gigantes o nuestros antepasados neandertales. Su trabajo dice mucho de lo que podemos esperar de la IA en todos los ámbitos, no sólo el científico. Es sensacional, en primer lugar, la capacidad de esta tecnología para alumbrar espacios de la realidad que hasta ahora permanecían ocultos.

“Hace unos años se nos ocurrió que podíamos visualizar la biología como una gran cantidad de código”, continúa en conversación desde Filadelfia (EEUU). “El ADN está compuesto de nucleótidos, un código de cuatro letras, las proteínas por un código de 20 letras, los aminoácidos. Si se conceptualiza de esa manera, podemos desarrollar algoritmos para explorarlo”.

Nuestro genoma es, en realidad, una inconmensurable fuente de información. La clave es encontrar esas valiosas moléculas codificadas, escondidas en él, muchas de las cuales pueden ser potenciales antibióticos. César de la Fuente y su equipo desarrollaron distintos métodos para lograrlo. Fue entonces cuando se plantearon por qué no seguir buscando péptidos (cadenas cortas de aminoácidos que actúan como bloques de construcción de proteínas) a lo largo de la evolución natural.

“Miramos a nuestros antepasados más cercanos, los neandertales, con un modelo de machine learning, y encontramos péptidos ahí también”. Me muestra un modelo en 3D de una proteína de mamut. Un extremo de la hélice es de color rojo, a diferencia del gris del resto. “Es uno de los antibióticos que el algoritmo encontró. Lo pudimos sintetizar en el laboratorio y es efectivo en modelos de ratón”.

Como en otros ámbitos de la innovación científico-tecnológica, el estallido de la IA generativa, tanto en el software como, sobre todo, en la capacidad de procesamiento de los nuevos chips, ha sido la palanca definitiva. “Antes, no teníamos los métodos computacionales para poder hacer esto a escala de manera digital”.

El laboratorio que dirige en la Universidad de Pensilvania se ha propuesto llevar la biología al ámbito digital y no constreñirse al mundo físico, utilizando modelos de IA como APEX, probablemente el más poderoso construido hasta ahora en su campo. La velocidad del descubrimiento se acelera también de forma “dramática”, según César de la Fuente.

Con métodos tradicionales, se puede tardar entre seis y siete años en descubrir uno o dos compuestos, “hoy en día en unas horas podemos encontrar cientos de miles en mi laboratorio”. Tienen que validarse en la fase clínica, pero los tiempos han quedado dinamitados.

El secreto del éxito del investigador español reside fundamentalmente en los puntos de partida. Además de pensar en la IA como herramienta clave, intuyó lo que llama la “hipótesis de los datos estándar: para que los modelos de IA fueran exitosos, hemos dedicado años a generar nuestra propia base de datos para entrenarlos. Si quieres que la IA tenga éxito, genera tus propios datos de cero”.

César de la Fuente quiere combinar todos los modelos de IA con aplicación en biología e integrarlos en un sistema, con un agente artificial que permita navegar a través de ellos. Su equipo está dando ya los últimos toques a una página web que permitirá a todo el mundo hacer descubrimiento de antibióticos.

Podremos acceder a través del móvil o del ordenador al modelo preentrenado de APEX Search e introducir un genoma. Recibiremos un correo electrónico con el ranking de moléculas presentes en él. “Es una forma de atraer a los más jóvenes y democratizar el proceso de descubrir nuevos antibióticos”.

¿Las alucinaciones de la IA generativa son un problema? Más bien al contrario. “Esos procesos de alucinación puede ser positivos en porque introducen un elemento de creatividad, si lo piensas en ese sentido. Usados bien y, obviamente, validando todo experimentalmente después pueden ser interesantes”.

En realidad, el principal obstáculo para la aceleración del descubrimiento de antibióticos, pese a las llamadas de alerta de organismos como la OMS y la Unión Europea por el peligro de las superbacterias, es que “no hay mercado, es tremendamente difícil penetrar ahí; hacer dinero, imposible”.

A las farmacéuticas no les interesan los antibióticos, son baratos y se usan de forma ocasional, a diferencia de los medicamentos para dolencias crónicas. “O alguien muy rico financia por el bien de la humanidad un proyecto grande o bien lo hacen los gobiernos”. El dato causa escalofríos: desde los 80 no se registra un nuevo antibiótico.