Empresas

Qué significa el lanzamiento de DeepSeek para el mercado de la IA humana

El éxito de DeepSeek se basa en una idea casi paradójica: si gran parte del entrenamiento de la IA depende del trabajo humano (especialmente para tareas como clasificar resultados o etiquetar datos), ¿cómo puede una empresa emergente reducir los costos reduciendo esa mano de obra? Para DeepSeek, la respuesta estaba en apoyarse en datos sintéticos, aprendizaje autosupervisado y ciclos de refuerzo impulsados ​​por IA.

El enfoque de DeepSeek señala un cambio: menos manos humanas, pero una guía humana más inteligente.ESTO ES INGENIERÍA

En algún lugar en el corazón de cada industria en rápida expansión se encuentra una tensión entre los viejos métodos y las nuevas direcciones. En el mundo de la IA, esa tensión es la más importante en este momento: hemos visto una oleada de etiquetado de datos y aprendizaje reforzado a partir de la retroalimentación humana (RLHF, por sus siglas en inglés) que llegó al mercado, donde ejércitos de personas entrenan y mejoran los modelos de lenguaje grandes (LLM, por sus siglas en inglés). Luego aparece un nuevo participante, DeepSeek, que lanza un modelo de vanguardia a una fracción del costo habitual. Y tiene a todos en los círculos de tecnología, marketing y estrategia entusiasmados: si DeepSeek puede reducir las necesidades de intervención humana (HITL, por sus siglas en inglés), ¿señala un nuevo manual para el desarrollo de LLM?

¿Qué está pasando y cómo esto puede transformar el panorama empresarial de los servicios de IA?

La sorprendente eficiencia de DeepSeek

El éxito de DeepSeek se basa en una idea casi paradójica: si gran parte del entrenamiento de la IA depende del trabajo humano (especialmente para tareas como clasificar resultados o etiquetar datos), ¿cómo puede una empresa emergente reducir los costos reduciendo esa mano de obra? Para DeepSeek, la respuesta estaba en apoyarse en datos sintéticos, aprendizaje autosupervisado y ciclos de refuerzo impulsados ​​por IA.

En lugar de emplear grandes equipos de etiquetadores, DeepSeek utilizó de forma selectiva la aportación de información humana, dirigida y a nivel de expertos. A continuación, escalaron el volumen de entrenamiento a través de datos generados por el modelo, en esencia, una secuencia de aprendizaje entre profesor y alumno en la que las versiones anteriores de DeepSeek producían texto mientras que el nuevo modelo aprendía de esos resultados. En otras palabras, crearon un círculo virtuoso de “cocreación” de IA, en el que los resultados del modelo alimentaban su siguiente fase de entrenamiento.

¿Significa eso que DeepSeek abandonó por completo la retroalimentación humana? No exactamente. Adoptó un enfoque de “calidad por sobre cantidad”, recurriendo a expertos solo cuando podían aportar el máximo valor, en particular en tareas de ajuste fino de razonamiento. Mientras tanto, los enfoques estándar de RLHF que requieren ejércitos de humanos vieron la puerta cerrada. El método de DeepSeek dio como resultado un ciclo de entrenamiento ágil y consciente de los costos que aún mantenía un rendimiento sólido del modelo.

Un cambio más amplio en la “cadena de valor” de la IA

En mis años de experiencia ayudando a las marcas a repensar la creatividad y la colaboración, veo un patrón familiar aquí: los actores emergentes se lanzan con modelos de colaboración no convencionales y presionan sobre los métodos tradicionales. En la estrategia de marca, eso podría significar aprovechar el crowdsourcing de clientes o pasar de los grupos de discusión a la escucha en las redes sociales. En IA, los grandes contratos de etiquetado se sustituyen por soluciones más ágiles impulsadas por IA.

Ya vemos otros laboratorios (desde Meta hasta comunidades de código abierto) que experimentan con el aprendizaje por refuerzo a partir de la retroalimentación de la IA (RLAIF, por sus siglas en inglés) o la “IA constitucional”. Estos enfoques automatizan piezas del rompecabezas del etiquetado con algoritmos, lo que reduce drásticamente la necesidad de grupos de evaluadores humanos a gran escala. La velocidad a la que evolucionan estos nuevos métodos indica que la estrategia de DeepSeek es más que un caso atípico: es la punta de lanza de un cambio más amplio en la forma en que entrenamos y alineamos modelos avanzados.

Qué significa esto para los proveedores de HITL

Si está ejecutando una plataforma HITL, el éxito de DeepSeek debería ser como un disparo de advertencia. Sin embargo, esto no significa que todo el mercado de HITL desaparecerá. En cambio, está reorganizando las cartas:

1. Calidad por sobre cantidad

Las tareas rutinarias de etiquetado (como clasificar sentimientos básicos) pueden estar en declive a medida que los datos sintéticos y los ciclos de retroalimentación de la IA mejoran. Sin embargo, las tareas especializadas o específicas de un dominio siguen siendo fundamentales. Ya sea refinar argumentos legales, depurar código o evaluar compensaciones éticas matizadas, estos aspectos de la IA aún necesitan la visión humana. Ahí es donde prosperan los expertos de primer nivel y bien capacitados. El extremo inferior del mercado se convertirá en un producto básico.

2. La experiencia se vuelve un valor agregado

Observe cómo DeepSeek implementó un aporte humano limitado pero experto. Cada vez más, la industria pagará un valor agregado por grupos más pequeños de profesionales capacitados (en lugar de grandes grupos de etiquetadores principiantes) que puedan abordar tareas complejas que los algoritmos aún no pueden manejar.

3. Realineamiento a largo plazo

Con el tiempo, a medida que maduren el aprendizaje autosupervisado y los ciclos de retroalimentación automatizados, es probable que disminuya el volumen total de tareas que requieren mano de obra humana. Pero las tareas que queden serán más especializadas y potencialmente más lucrativas. Adaptarse a esa realidad (cambiar la fuerza laboral de soluciones de mano de obra masiva a servicios con gran carga de conocimiento) será crucial para los proveedores de HITL.

4. Los datos de entrenamiento como un activo dinámico

Así como los especialistas en marketing de marcas aprendieron a ver a los consumidores menos como una audiencia estática y más como cocreadores, los desarrolladores de IA están aprendiendo a ver los datos como un recurso dinámico y renovable. La generación de datos sintéticos, la reproducción automática de modelos y las mejoras iterativas significan que HITL ya no es un paso único; es un mecanismo de retroalimentación en evolución que cada vez se puede automatizar más.

Cosas que puedes hacer

Desde la perspectiva de un estratega de negocios, la pregunta es: ¿Cómo aplicamos las lecciones de DeepSeek para obtener una ventaja, ya sea como proveedor o usuario de los servicios de HITL?

1. Reinvente su oferta

Considere la posibilidad de orientarse hacia la “anotación estratégica”, las tareas especializadas que aún no se pueden automatizar. Cree programas de capacitación sólidos para expertos, diferencie por dominio de competencias y enfatice la calidad y la profundidad del conocimiento.

2. Adopte HITL asistida por IA

Incluso si tiene una plataforma HITL establecida, agregue automatización a sus ofertas. Desarrolle herramientas que permitan que grupos más pequeños de humanos supervisen los procesos de anotación impulsados ​​por IA. Es la combinación de automatización y artesanía humana lo que se destacará en el mercado.

3. Sea el curador

Las empresas aún necesitan la curaduría para garantizar que su IA se alimente con datos de alta integridad. Eso significa verificar, filtrar y auditar datos que podrían ser total o parcialmente generados por máquinas. Un curador experto, alguien que pueda verificar que el contenido sintético sea relevante, preciso y ético, se convierte en un papel fundamental en el nuevo ecosistema.

El futuro de la colaboración en IA

En mi trabajo, suelo hablar del poder de la cocreación y la colaboración. Durante un tiempo, los “humanos en el circuito” fueron la fuerza principal detrás del perfeccionamiento de los resultados de la IA. Ahora, estamos viendo que el circuito se está expandiendo, con la propia IA proporcionando retroalimentación a otros sistemas de IA. Eso no deja de lado la creatividad humana; les da a las personas el espacio para hacer un trabajo más matizado y de alto nivel, de la misma manera que el talento abierto y la innovación en marketing finalmente liberaron a los equipos creativos para centrarse en ideas estratégicas más significativas.

El lanzamiento de bajo costo de DeepSeek subraya que la tecnología detrás de los modelos de lenguaje de gran tamaño está evolucionando rápidamente. Pero también destaca una lección empresarial perenne: la disrupción tiende a surgir de aquellos dispuestos a jugar con nuevas reglas. En el corto plazo, el mercado de HITL se orientará hacia la experiencia y la curaduría. En el largo plazo, veremos un menor volumen de tareas realizadas por personas especializadas, y el etiquetado rutinario será asumido por bucles de retroalimentación ejecutados por IA.

Como en cualquier transformación, los ganadores serán aquellos que reimaginen su papel en la cadena de valor, pasando de ser meros proveedores de mano de obra a convertirse en socios estratégicos en la intersección de los datos, la ética y la innovación. Si podemos aprovechar esa oportunidad, el futuro de la IA podría ser menos una cuestión de fuerza bruta y más de colaboración inteligente, ingeniosa y genuinamente creativa, tanto entre humanos como entre máquinas.

Artículos relacionados