No es ningún secreto que Mark Zuckerberg -el cuarto millonario en la lista Forbes– ha reconvertido las prioridades de Meta en los últimos meses. Por un lado, empresa ha estado invirtiendo de manera significativa en el desarrollo y la implementación de la IA para transformar sus productos y poder posicionarse en este ámbito a nivel global. Esto es: intentar desbancar a OpenAI en su reinado.
Era el verano de 2023, las inversiones a gran escala de la empresa han pasado por destinar recursos al NLP (o procesamiento del lenguaje natural, como los chatbots y traductores automáticos), avances en el reconocimiento facial y de objetos (para mejorar algunas de sus aplicaciones como Instagram y Facebook) y el lanzamiento de modelos funcionales, algo que les ha tenido ocupados los últimos tres meses. Además, la apuesta de Meta por el metaverso está profundamente vinculada con la IA como una prioridad total de su fundador, que ha enfatizado «cómo la IA permitirá experiencias más inmersivas y personalizadas en mundos virtuales».
Aunque la multinacional californiana lanzó la primera versión de LLaMA (Large Language Model Meta AI, por sus siglas en inglés) en febrero de 2023 -un modelo que fue diseñado como una familia de lenguaje de código cerrado y son optimizados para ser más eficientes en tamaño y coste- el pasado mes de septiembre, Zuckerberg testó la segunda versión en una presentación a prensa. De hecho, este lanzamiento marcó una encrucijada clave para Meta y Zuckerberg: el comienzo de una remontada estelar gracias a una tecnología con la que luego lanzaron Llama 3 en abril y julio de 2024, alcanzando (y casi adelantando) en gran medida a sus rivales de código cerrado.
En varios puntos, el último modelo de Llama 3 superó a los modelos más avanzados de OpenAI y Anthropic, compartiendo además datos públicamente de miles de millones de cuentas de Facebook e Instagram para entrenar a sus modelos de IA. Además, Zuckerberg, que lleva mucho tiempo promocionando la tecnología de código abierto (el propio Facebook se creó con software de código abierto), sigue defendiendo esta política como salvoconducto de su política.
En retrospectiva, el anuncio inicial de LLaMA estaba dirigido principalmente a investigadores y académicos, con el objetivo de democratizar el acceso a la inteligencia artificial avanzada, aunque los medios no han tardado en señalar que podría posicionarse como un posible rival del GPT-4 de OpenAI. Después de que esta versión se filtrase en internet, se popularizó entre los desarrolladores que por su código abierto y tecnología de última generación, lo que significaba que -a diferencia con los grandes modelos de lenguaje (LLM) de OpenAI, Google y Anthropic- podían acceder al código subyacente y a sus «pesos» (que determinan cómo el modelo procesa la información) para usarlo, modificarlo o mejorarlo, junto con los investigadores y otros usuarios.
Yann LeCun, científico jefe de IA de Meta, y Joelle Pineau, vicepresidenta de investigación de IA y directora del equipo Investigación Fundamental de IA (FAIR, por sus siglas en inglés) de Meta, querían que esta versión se lanzara en código abierto. Ambos declararon estar convencidos de que estas ventajas de Llama 2 permitirían que el modelo se volviera más potente más rápidamente (y a un menor coste).
A pesar de esto, la empresa expresó dudas sobre la dificultad de monetizar. Tal y como señalaron otros ejecutivos en varios debates sobre el tema, las repercusiones legales eran potencialmente desagradables: ¿Qué ocurriría si alguien piratease el modelo? Tampoco ha ayudado que los dos lanzamientos anteriores de productos de IA de código abierto de la empresa fracasaran estrepitosamente, con unas respuesta negativa en EEUU -desde científicos hasta senadores-.
Además, y tras muchas preciones, Zuckerberg tomó la decisión de lanzar Llama 2 finalmente como un modelo de código abierto alegando simplemente: ‘Está bien, lo haremos». Posteriormente, el 18 de julio de 2023, la empresa comunicó que lanzaba oficialmente Llama 2 «gratis para investigación y uso comercial».
Previamente, en 2022, Meta anunció el desarrollo de un supercomputador de IA, el AI Research SuperCluster (RSC), diseñado para entrenar modelos avanzados de IA que procesen datos a gran escala.
Con competidores directos como Google, Microsoft y OpenAI en el desarrollo de tecnologías de IA, la empresa ha calculado que los avatares impulsados por la IA, junto con los interfaces inteligentes (que entiendan el lenguaje y, sobre todo, las emociones humanas) en los entornos interactivos adecuados, generados por esta tecnología, suponen la apuesta definitiva para posicionarse como líderes en el mercado. A esto se suman las herramientas de aprendizaje profundo como PyTorch, que se ha convertido en una de las bibliotecas más utilizadas en el mundo de la IA, lo que democratiza definitivamente el acceso a la tecnología y fomenta la innovación en toda la industria.
Asimismo, Meta colabora activamente con universidades y centros de investigación en EEUU para avanzar en la IA básica, no solo en aplicaciones comerciales, sino también para generar conversaciones acerca de la ética en IA, sesgos en modelos y eficiencia tecnológica. Su enfoque estratégico está así centrado en modelos abiertos, con una infraestructura reforzada y aplicaciones (no de última sino de próxima) generación para jugar el papel de actor central en la (re)evolución de la IA.