Empieza a calar la idea de que los recortes de plantillas que vienen produciéndose en el sector TIC y en sus remasterizaciones (banca, consultoría, telecomunicaciones, grandes corporaciones…), se debe en realidad al impacto de las voluptuosas facturas de la inteligencia artificial (IA). Una conocida empresa de grandes almacenes española habría decidido levantar el pie del acelerador, de momento, después de toparse con recibos de decenas de miles de euros, por andar jugueteando con tokens, el trasunto matemático de la realidad que utiliza la IA generativa para operar. El coste financiero para las grandes tecnológicas empieza a resultar serio.
El CEO de Microsoft, Satya Nadella, lo dijo claramente en el pasado Foro de Davos: la clave para que se aproveche esta tecnología a nivel de país es obtener el mejor resultado posible en la relación “tokens por dólar por vatio”. Y la fórmula puede extrapolarse a cualquier empresa. Para Nadella, la IA computa como la electricidad, “solo necesitarás una red ubicua de energía y tokens para impulsar al resto de la economía”, afirmó.
El cántabro Bruno Cendón, director de IA y arquitectura de dispositivos en Meta Reality Labs, el laboratorio que está definiendo, entre otras muchas cosas, las gafas de realidad virtual y aumentada del futuro, nos acaba de poner en alerta: “cuando cuatro CEOs de empresas de chips suben a distintos escenarios en la misma semana y dicen lo mismo, merece la pena prestar atención”.
Ha sido en Computex 2026, el gran evento mundial sobre semiconductores que se celebra cada año en Taipéi (Taiwán). El mensaje compartido por todos ellos es que la IA no va a reposar sobre una herramienta a la espera de que la utilicemos, de que la activemos, sino que se va a convertir en un agente que funcionará continuamente en nuestro nombre, con autonomía total, 24/7. Hay factores muy poderosos que limitan hoy esta visión, como venimos insistiendo, pero ¿es el horizonte hacia el que avanza todo? Sí.

Ese es el futuro que han descrito en Computex 2026 cuatro corifeos fundamentales del sector de los semiconductores: Jensen Huang (NVIDIA), Cristiano R. Amon (Qualcomm), Lip-Bu Tan (Intel) y René Haas (Arm). Ahora se trata de hacer compatible esta visión con lo que se conoce ya como la “economía de los tokens” de la que habla Nadella. Que la factura no se dispare hasta el punto de hacerlo inviable. Si quieres tener éxito, asegúrate de dejar contento, no lo olvides nunca, a tu director financiero (CFO).
Lo interesante del siguiente paso evolutivo del superciclo de la IA en el que estamos comenzando a entrar es que no existe una visión única al respecto. Las discrepancias radican en dónde debe producirse el proceso clave de la IA, llamado inferencia, gracias al cual un modelo ya entrenado produce una respuesta a partir de datos nuevos.
Huang está convencido de que habrá “más agentes que personas», y lleva varios meses presentando unos espectaculares procesadoresnuevos,diseñados explícitamente para que los utilicen agentes de IA con capacidad de inferencia… no humanos. Nvidia ha desvelado en Computex, de la mano de Microsoft, el superchip RTX Spark con el que un PC con Windows pasará a ser un superordenador con IA. «Ya no es solo una ventana a internet, sino una mente soberana y sin ataduras que opera las 24 horas del día», asegura.
Qualcomm cree que es posible convertir los 6.000 millones de teléfonos, 2.000 millones de dispositivos portátiles, 2.000 millones de ordenadores y 500 millones de vehículos conectados que existen hoy en el mundo en puntos finales de inferencia para esos agentes de IA que estarán funcionando continuamente en segundo plano. Para ello, cuenta con el potencial por descubrir de las futuras redes 6G, aún en mantillas.
A ese futuro descrito por Cristiano Amon contribuirán desde dispositivos portátiles de menos de un milivatio hasta centros de datos de miles de kilovatios, sin que la experiencia del usuario se vea afectada. Una puerta abierta a la innovación, porque aún no existe un dispositivo ambiental, siempre activo, siempre disponible, que dure todo el día. “La arquitectura para impulsarlo representa un desafío completamente distinto a todo lo anunciado esta semana en Taipéi”, dice Bruno Cendón.
La enorme explosión de tokens que producirán los agentes de IA nos ha introducido, en definitiva, en una realidad dura y contundente: además del riesgo de disparar la factura, depender únicamente de esos gigantes tecnológicos centralizados en la nube, es financiera y físicamente imposible debido a las restricciones de la red energética, los límites de ancho de banda y los costes operativos. Computex 2026 cree que sus sistemas tendrán que colaborar con los dispositivos de procesamiento ubicados cerca del lugar donde las respuestas de la IA van a ser aprovechadas.
Durante los próximos meses se comenzará a definir, por tanto, el modelo de computación distribuida que permitirá hacer viable el despliegue de los agentes de la IA. Es una de las muchas cosas que quedaban pendientes (otra es la disponibilidad de datos de calidad) antes de preocuparnos de la robotización de nuestra sociedad y de las posibilidades de la IA física, como venimos diciendo algunos desde hace tres años.
Mientras tanto, siempre se pueden encontrar soluciones a medida para ahorrar en el viaje hacia la IA generativa. TokenTuner, por ejemplo, ayuda a controlar los costes de la IA al identificar dónde se pueden utilizar modelos de manera más productiva y barata en las empresas. Vincula el uso de los tokens con los resultados comerciales y evalúa a individuos y a los equipos según la eficacia con la que utilizan el presupuesto asignado. Otra opción es Together AI, que opera una plataforma de IA en la nube diseñada específicamente para la inferencia, no para el entrenamiento, y proporciona acceso a más de 200 modelos abiertos.
Tenía que suceder. A medida que aumenta el uso de la IA, la capacidad de ejecutar modelos y proporcionar respuestas de manera eficiente se está volviendo más relevante que la capacidad de entrenarlos. La arquitectura es incluso más importante que los cientos de miles de millones de parámetros que volcamos en ellos. Esa fina capa de orden que proporciona el propósito.

