Start-ups

La IA de una startup de 2 mil millones que pone en jaque el trabajo de los programadores

Los programadores temen que la IA de esta startup de 2.000 millones de dólares pueda reemplazar sus trabajos.

Foto: Forbes US

Con un respaldo de 200 millones de dólares en financiación, Scott Wu, de 28 años, y su equipo de codificadores competitivos en Cognition están construyendo una herramienta de inteligencia artificial que puede programarse completamente por sí sola, como un «ejército de ingenieros jóvenes».

Justo antes de Navidad en 2023, el pequeño equipo de Cognition estaba luchando por configurar un servidor de datos particularmente complejo para el asistente de codificación incipiente de la startup de inteligencia artificial con sede en San Francisco, Devin. Habían pasado horas estudiando documentos de instalación y probando diferentes comandos, pero simplemente no podían lograr que funcionara. Cansados ​​y frustrados, decidieron ver cómo lo manejaría Devin.

Cuando la IA entró en acción, confundió a sus creadores. «Ejecutó los comandos más brujos y de magia negra», recuerda el cofundador y director de producto Walden Yan, de 21 años. Durante un tiempo, parecía que Devin no lo haría mejor que ellos. Entonces, una luz de terminal de servidor que había estado roja durante horas se volvió verde. El servidor de datos estaba en funcionamiento.

scott wu-cover-credit-Cody Pickens for Forbes
Cody Pickens para Forbes

Devin había eliminado un archivo defectuoso del sistema que el equipo había pasado por alto, se dieron cuenta. “Ese fue el momento en que realmente me di cuenta de cuánto va a cambiar la ingeniería de software”, dice Yan.

Fue la primera tarea importante que Devin completó y la prueba de concepto de la visión de Cognition de que la IA eliminara el trabajo pesado de la codificación. Ahora, casi un año después, Devin se encarga de tareas básicas de ingeniería: detectar y corregir errores, actualizar fragmentos de código y migrarlos entre plataformas. Dale una instrucción simple: “limpia esta base de código”, y crea un plan de acción y lo ejecuta. La mayoría de las veces, funciona.

Es un enfoque diferente al de otros actores más conocidos y más grandes en el campo aún floreciente, como Github (que Microsoft compró por 7.5 mil millones de dólares en 2018) y Codeium, valorado en 1.3 mil millones de dólares, que brindan asistentes digitales que ayudan a las personas a escribir código con sugerencias impulsadas por IA. Pero Devin es un agente de IA autónomo que, en teoría, escribe el código por sí mismo (sin personas involucradas) y puede completar proyectos enteros que normalmente se asignan a los desarrolladores (el nombre Devin proviene de «dev», una abreviatura del término). «Lo que vimos es una oportunidad real», dice Scott Wu, de 28 años, cofundador y director ejecutivo de Cognition, «para pasar de la finalización de texto a la finalización de tareas».

El código generado por IA ya está empezando a remodelar la industria. En octubre, el director ejecutivo de Google, Sundar Pichai, dijo que más de una cuarta parte del código nuevo en el gigante tecnológico está escrito por IA. En Github, que alcanzó una tasa de ejecución anual de 2 mil millones de dólares en 2024, su herramienta de finalización de código ha representado el 40% del crecimiento de los ingresos este año, dijo el director ejecutivo de Microsoft, Satya Nadella, en julio. El analista de Pitchbook, Brendan Burke, dice que la codificación de IA se ha convertido en el caso de uso más financiado en IA generativa, y las nuevas empresas centradas en ella recaudaron más de mil millones de dólares solo en la primera mitad de 2024.

Los ingresos reales apenas han comenzado a crecer: la firma de investigación IDC espera que superen solo los 4 mil millones de dólares para 2029. Varias empresas emergentes de codificación de IA han superado los 10 millones de dólares en tasas de ingresos anuales; Cognition se negó a compartir los ingresos, pero el presidente Russell Kaplan dice que ha firmado docenas de clientes, con un contrato anual típico de seis a siete cifras. Pero la oportunidad es lo suficientemente emocionante como para que gigantes como Anthropic, Amazon e IBM hayan lanzado sus propias herramientas de codificación, junto con empresas emergentes como Poolside (valoración de 3 mil millones de dólares) y Anysphere (valoración de 400 millones de dólares). La capacidad de escribir código ya se ha convertido en «una apuesta segura» para el modelo típico de IA, dice el analista de IDC Ritu Jyoti, quien señala que el líder en el espacio sigue siendo ChatGPT de OpenAI. Pero la codificación de IA que puede funcionar completamente por sí sola como la que está desarrollando Cognition «traerá un cambio radical».

Puede que no sea una gran noticia para los 5 millones de estadounidenses que trabajan como programadores y que ganan un salario medio de 130.000 dólares, y mucho menos para los 13 millones de programadores de India y China. Wu insiste en que no es inminente una pérdida masiva de puestos de trabajo y que el sector ha sido “limitado por la oferta”.

Los programadores cotidianos pueden ser cautelosos, pero a los inversores les encanta. El Founders Fund de Peter Thiel y Khosla Ventures apuestan por Wu y su equipo de 25 personas, invirtiendo 176 millones de dólares en Cognition en una ronda de Serie B en abril, lo que elevó su valoración a 2.000 millones de dólares solo seis meses después de su fundación. La inyección de efectivo se produjo solo tres meses después de que la startup cerrara una ronda de Serie A de 21 millones de dólares en enero.

Entre sus clientes se encuentran la empresa de gestión de gastos Ramp, de 300 millones de dólares (ingresos anualizados de 2023), que lo utiliza para escribir pruebas y limpiar código muerto, y la plataforma de datos MongoDB, de 1.700 millones de dólares (ingresos del ejercicio 2024), para la que Devin actualiza la arquitectura de código obsoleta, ahorrando a sus clientes millones, afirma el director de productos Sahir Azam. Los programadores de la fintech Nubank, de 8.000 millones de dólares (según ingresos de 2023), lo están utilizando para tareas como actualizar repositorios de código.

Todavía es pronto, pero el socio de Founders Fund, John Luttig, invirtió en Cognition en parte porque cree que tiene suficiente ventaja como para que «ponerse al día con ellos en cuanto a agentes de codificación sea muy difícil». Microsoft parece tener una corazonada similar. Firmó una asociación en mayo para ofrecer Devin a los desarrolladores en su nube Azure, y el director de tecnología Kevin Scott lo elogió como una herramienta «extraordinaria» en la conferencia anual de desarrolladores de la empresa.

Pero Silicon Valley está plagado de empresas que tenían una ventaja gloriosa sobre Amazon y Google, hasta que dejaron de tenerla. Los promotores de Cognition apuestan a que, si alguien puede crear la máquina de codificación definitiva, son tres programadores de clase mundial con los elogios necesarios para demostrarlo. Los fundadores son todos programadores con medallas de oro en las Olimpiadas que se conocieron en el circuito de programación competitiva. Wu era un genio de las matemáticas en la escuela primaria con una clasificación de “gran maestro legendario” (la más alta) en Codeforces, un sitio de redes para programadores que organiza concursos de codificación. Eric Glyman, un inversor ángel de Cognition y director ejecutivo de Ramp, dice que Wu tiene uno de los “cinco coeficientes intelectuales más altos de todos los que he conocido”.

“Scott es claramente brillante, curioso y de ambición ilimitada”, dice Sarah Guo, una capitalista de riesgo que ha invertido en Cognition en tres rondas de financiación a través de su empresa, Conviction. Wu también es un exalumno de Forbes 30 Under 30: apareció en la lista en 2019 por su empresa anterior, Lunchclub, que utiliza inteligencia artificial para concertar reuniones de networking. Un inversor de Cognition le dijo a Forbes que Wu se fue en 2022 porque sus intereses se habían trasladado a otra parte (Wu se negó a hacer comentarios), y Lunchclub, que ha recaudado alrededor de 30 millones de dólares, sigue avanzando.

Cognition lanzó Devin en marzo y generó mucho revuelo. En un video de demostración que acumuló 30 millones de vistas en X, la compañía afirmó que Devin había «superado con éxito las entrevistas prácticas de ingeniería de las principales empresas de inteligencia artificial» y completado tareas de codificación complicadas. Algunos ingenieros quedaron impresionados por las habilidades técnicas de Devin; otros temieron por sus trabajos. Poco después del lanzamiento, resurgió un video de Wu como estudiante de séptimo grado dominando una competencia de matemáticas, con comentaristas en línea bromeando: «No es humano, es una IA» y «Devin es solo Scott respondiendo tus preguntas en una aplicación de mensajería».

Entonces, Carl Brown, un conocido desarrollador independiente de Austin, Texas, denunció las travesuras. En un video titulado «Desmintiendo a Devin», visto más de 500.000 veces, acusó a Cognition de vender demasiado a su ingeniero de inteligencia artificial. Su revisión descubrió que Devin tardó mucho más de lo que un humano completaría el trabajo y que introdujo errores en el camino.

Experiencias como estas han llevado a algunos a preguntarse si Devin es simplemente más aire inflado en la burbuja de la IA. Pídale que diseñe una interfaz de usuario llamativa y los resultados son monótonos, dice Krish Manair, ingeniero de la empresa de etiquetado de datos Labelbox, que probó las capacidades de creación de aplicaciones web de la herramienta. Varios fundadores rivales dijeron a Forbes que creen que la empresa ha prometido demasiado sobre las capacidades de Devin, haciendo parecer que un ingeniero podría usar Devin directamente para codificar cualquier cosa. Sus capacidades actuales, argumentan, son mucho más limitadas y están orientadas a tareas predefinidas como limpiar el código existente. En una demostración en vivo, Forbes le pidió a Devin que creara una aplicación para afinar una guitarra. La creó en unos 10 minutos, pero la aplicación no pudo identificar correctamente las notas musicales tocadas para probarla, y los fundadores de Cognition no estaban seguros de por qué. «Siempre existe esta brecha entre la publicidad de lo que es posible y lo que funciona de manera confiable», dice Varun Mohan, CEO de la startup de codificación rival Codeium.

Wu admite que Devin está lejos de ser perfecto. “La ingeniería de software en el mundo real es muy desordenada”, dice desde la sede de Founders Fund con vista a la bahía de San Francisco. “Los humanos escriben errores todo el tiempo”. Y para ser justos, múltiples detractores quedaron impresionados con las capacidades de la herramienta. Devin ha mejorado significativamente en los siete meses desde su lanzamiento, afirma Wu, en parte gracias a los comentarios de los primeros clientes empresariales que parecen aceptar el agente como un trabajo en progreso. “No vemos la herramienta como algo que esperamos que sea mágico”, dice el director de tecnología de Nubank, Vitor Olivier. “Somos cautelosamente optimistas”. En algunos casos, dice, los ingenieros con acceso a Devin fueron ocho veces más rápidos en sus trabajos.

Cognition sigue experimentando. A principios de este año, le dio a Devin la capacidad de lanzar IA subordinadas para que lo ayudaran. Pero cuando Cognition probó este nuevo modo de «gerente», descubrió que los sub-Devin lanzaban a sus propios subordinados, que a su vez lanzaban aún más, creando un bucle enorme e interminable de burocracia de IA. «Al final tuvimos que cancelar el trabajo porque simplemente seguían delegando el trabajo», dice Kaplan.

Dicho esto, Kaplan señala que la herramienta funciona mejor cuando varios Devin trabajan simultáneamente en diferentes proyectos, como un «ejército de ingenieros junior». Esa es una frase que probablemente incomode a algunas personas que se ganan la vida programando, y Wu dice que parte de la negatividad hacia Cognition proviene de la ansiedad sobre si la IA eliminará los trabajos de ingeniería de software. Devin podría permitir a las empresas realizar más proyectos, sostiene, contratando humanos para hacer el trabajo más significativo.

«Realmente hay mucho miedo», dice. «La gente tiene muchas preguntas sobre lo que sucede en este nuevo paradigma».