En su trabajo diario, la lucha más reciente de Scott O’Neil fue luchar contra una ola de frío a finales de enero en Covington, Luisiana, a unas 40 millas al norte de Nueva Orleans. Scott, un empleado de ventas de plomería, dijo que el teléfono no había dejado de sonar desde que las temperaturas bajaron a un solo dígito. «Ha habido mucho movimiento. Heladas. Tuberías rotas», le dijo a Forbes .
Pero por la noche, O’Neil se enfrenta a un conjunto diferente de desafíos: entrenar modelos avanzados de IA. Pasa varias horas a la semana calificando las respuestas que generan bots como ChatGPT, trabajando como contratista para Scale, la empresa de datos de IA de 14 mil millones de dólares. Las tareas varían. A veces evalúa una respuesta de IA para que sea objetiva y esté bien escrita, y «no suene robótica». O le dan dos respuestas y elige la mejor. Si ambas son malas, la reescribe por completo. O’Neil, que tiene un título en desarrollo web, normalmente gana entre 300 y 1000 dólares a la semana por su trabajo, dependiendo de la cantidad de horas que dedique.
O’Neil es uno de los cientos de miles de trabajadores de clics en Outlier, una plataforma propiedad de Scale donde los trabajadores autónomos realizan tareas pagadas para entrenar modelos de IA generativos para los clientes corporativos de Scale, entre los que se incluyen Google, Meta y OpenAI. También forma parte del segmento de colaboradores de Outlier que más rápido ha crecido durante el último año: los trabajadores en Estados Unidos, según dijo Scale a Forbes .
Scale estrenó Outlier en 2023, un año después de que el lanzamiento de ChatGPT de OpenAI desatara un frenesí mundial de la IA. Cuando un modelo de IA como Gemini de Google o Llama de Meta da una respuesta a una pregunta (un correo electrónico diplomático a su jefe, la solución a un problema de física de varios pasos o el código para una aplicación de lista de tareas pendientes), esas respuestas no son solo producto del aprendizaje automático. Tras bambalinas, legiones de trabajadores humanos han trabajado incontables horas para «afinar» esos modelos: calificando las respuestas, eliminando material inapropiado como violencia o abuso sexual y traduciendo textos de diferentes dialectos.
Pero a medida que la inteligencia artificial se vuelve cada vez más capaz de imitar el razonamiento humano, requiere cada vez más humanos altamente capacitados, a menudo con áreas de especialización específicas, para perfeccionar sus modelos.
“Queremos asegurarnos de que Estados Unidos tenga voz en estos modelos”.
Xiaote Zhu, director general, valor atípico
Eso incluye a los MFA que escriben cuentos cortos para que un modelo pueda aprender de la nueva prosa, a los doctores que se aseguran de que una IA aplique teoremas matemáticos correctamente o que escriban código al nivel de producción de un ingeniero de Facebook. Para completar estas tareas, Scale se ha apoyado cada vez más en colaboradores con un alto nivel educativo. El 87% de los clickworkers de Outlier tienen un diploma universitario. De ellos, el 48% tiene una licenciatura, el 27% tiene una maestría y el 12% tiene un doctorado, según informó la empresa a Forbes.
A medida que ha crecido su necesidad de expertos en el sector, también ha aumentado el enfoque de Scale en los EE. UU. como centro de referencia para sus trabajadores de clics, en lugar de subcontratar el trabajo en el extranjero. La empresa proporcionó en exclusiva a Forbes una instantánea geográfica del programa Outlier a medida que ha crecido en los EE. UU.: los colaboradores están repartidos en 9340 ciudades distintas de todo el país, siendo Houston, Chicago, Los Ángeles, la ciudad de Nueva York y Atlanta algunas de las grandes ciudades más populares. Las ciudades más pequeñas donde residen los colaboradores incluyen Rexberg, Idaho, y Lake Mary, Florida. El 19 % de los contratistas residen en zonas rurales.
El nuevo enfoque del programa en Estados Unidos encaja con la filosofía de “Estados Unidos primero” del director ejecutivo Alexandr Wang para la IA. Scale ha firmado varios contratos de defensa con el gobierno de Estados Unidos, incluidos los del Ejército, la Fuerza Aérea y la Unidad de Innovación de Defensa. Un nuevo contrato anunciado el miércoles, para un programa del Departamento de Defensa llamado Thunderforge, utilizará la tecnología de Scale para desplegar agentes de IA para uso militar. En enero, Scale publicó un anuncio de página completa en el Washington Post, con una carta abierta de Wang al presidente Donald Trump, instándolo a aumentar la inversión del país en inteligencia artificial, mientras Estados Unidos libra una “guerra” con China y otros por la supremacía de la IA.
Pero el enfoque de Scale en contratar estadounidenses va más allá de la creación de empleos en el país. Mientras China y otros países compiten por el liderazgo en inteligencia artificial, “queremos asegurarnos de que Estados Unidos tenga voz en estos modelos”, dijo a Forbes Xiaote Zhu, quien dirige Outlier .
“Básicamente, estamos incorporando la experiencia, los valores y las preferencias humanas a estos modelos”, afirmó. “Creo que es importante destacar que no se trata solo de la experiencia, sino también de los valores y las preferencias. Y, por supuesto, para ese propósito, es muy importante que tengamos personas que representen a los ciudadanos estadounidenses”.
“No sé cómo decirlo de forma amable, pero ellos creen que valen más de lo que valen, en cierto sentido. Sé que es una forma un poco grosera de decirlo”.
Scott O’Neil, contratista de Outlier
Outlier es uno de los pilares fundamentales del negocio de Scale. La empresa, que es privada y está valorada actualmente en 14.000 millones de dólares, dijo en septiembre que alcanzó los 1.000 millones de dólares en ingresos anualizados, pero no desglosa la contribución de Outlier. Pero con el crecimiento han llegado las críticas. En los últimos meses, Scale se ha enfrentado al menos a tres demandas de los contratistas de Outlier, alegando malas condiciones de trabajo, como falta de apoyo en materia de salud mental y robo de salarios, una acusación común contra las empresas tecnológicas que utilizan trabajadores contratados.
En noviembre, Scale nombró a Zhu, anteriormente director de operaciones de IA generativa de la empresa, como su primer director general para Outlier, para dirigir la plataforma a medida que avanza entre la atención cada vez más evidente y el crecimiento. «Obviamente, estamos dando forma al futuro de la IA», dijo Zhu. «Y con la adopción cada vez más amplia de la IA, lo que hacemos aquí juega un papel fundamental en cómo se desarrolla la IA».
Vivir en el bosque
La propuesta de Scale para los contratistas de Outlier es que se trata de la siguiente versión del trabajo por encargo, con la independencia de conducir Ubers o hacer entregas para Postmates, pero desde la comodidad de su hogar. (De hecho, el año pasado Uber anunció su propia plataforma de etiquetado de datos para contratistas, llamada Scaled Solutions).
Los contratistas atípicos, a veces llamados «taskers», trabajan en promedio unas seis horas a la semana. Pero los usuarios más prolíficos de la plataforma, como Karen Hart, una analista de datos a tiempo parcial de 46 años en Birmingham, Alabama, trabajan hasta 20 horas a la semana. Hart, que tiene una maestría en epidemiología, ha realizado «cientos, si no miles» de tareas, como calificar las respuestas de los modelos de lenguaje y escribir explicaciones de por qué. Los contratistas son contratados para trabajar en proyectos individuales y se les paga por hora o por tarea. Scale dice que las tasas de pago dependen de las calificaciones del colaborador, la ubicación geográfica y la demanda de los clientes. Hart dijo que generalmente gana entre 25 y 30 dólares por hora.
Uno de los principales atractivos es trabajar de forma remota. “Me encanta vivir en el bosque. Soy una especie de chico de campo”, dijo O’Neil. “Es agradable poder vivir en el campo y seguir conectado a la tecnología”.
Para los encargados de las tareas, el trabajo a veces puede conllevar conceptos erróneos. La mayoría de las personas se quedan desconcertadas cuando O’Neil les dice que entrena inteligencia artificial. Y quienes están familiarizados con el trabajo a menudo se imaginan a un trabajador solitario sentado frente a una computadora en un país lejano. Pero Hart dijo que encuentra camaradería en el chat de Discord de Outlier, donde los contratistas pueden hablar entre ellos, hacer preguntas sobre las tareas y obtener ayuda de los representantes de Scale. «Cuando inicio sesión, hay ciertos nombres de usuario que me alegra ver».
Los esfuerzos de etiquetado de datos de Scale comenzaron mucho antes que Outlier. En 2017, la empresa estrenó Remotasks, una subsidiaria enfocada principalmente en la anotación de software de IA para automóviles sin conductor, etiquetando árboles, peatones y otros objetos en secuencias de video para que el sistema de visión artificial de un vehículo pudiera identificarlos y reaccionar ante ellos. La plataforma, que tiene más de 240.000 trabajadores y todavía opera hoy, generó controversia por sus presuntos salarios bajos y sus vertiginosas limitaciones de tiempo, con acusaciones de contratistas predominantemente del Sur Global de que Scale explotaba a los trabajadores. Seis años después, Scale lanzó Outlier, que brinda los mismos servicios de capacitación de datos, pero para tareas de IA generativa.
“Es un trabajo que puede llevar horas de trabajo, en lugar de un trabajo que se centra en una sola pieza específica del rompecabezas”.
Vijay Karunamurthy, director de tecnología de campo, Scale
Zhu reconoce que el etiquetado de datos tiene un problema de reputación. “Podría deberse a que hace años, cuando la IA era menos avanzada, ese tipo de trabajo de anotación requería menos habilidad”, dijo. “Pero ahora estamos en una nueva era, por lo que los modelos de IA son mucho más avanzados”.
Eso significa un trabajo mucho más complejo por parte de los encargados de las tareas, dijo a Forbes Vijay Karunamurthy, director de tecnología de campo de Scale, que trabaja principalmente con los clientes corporativos de Scale. «Es un trabajo que puede llevar horas de tiempo», dijo. «En lugar de un trabajo que se centra en una sola pieza específica del rompecabezas».
Hart afirmó que desempeñar un papel más complejo en el desarrollo de los modelos significa que se siente más gratificada por el trabajo que está realizando para construir nuevos sistemas de IA. “Es como echar un vistazo a un libro que todo el mundo está esperando leer”.
Quejas crecientes
Algunas de las críticas que Scale enfrentó a Remotasks aún persisten. En enero, una demanda colectiva acusó a la empresa de infligir “daño psicológico grave” a los contratistas de Outlier al exponerlos a contenido perturbador, al tiempo que no brindaba apoyo adecuado en materia de salud mental a los trabajadores. Otra demanda alegó que Scale pagaba a los trabajadores por debajo del salario mínimo y los clasificó erróneamente como contratistas y no como empleados con beneficios y pago de horas extra. Una tercera demanda alegó problemas similares.
Zhu se negó a hacer comentarios sobre las demandas. “Lo que sé por el mero hecho de atender a los colaboradores en la plataforma es que la gran mayoría de ellos están bastante contentos con el trabajo”, afirmó. Señaló que la empresa ha abordado algunas de las cuestiones planteadas por los detractores, como mejorar el sistema de pago y ser más transparente sobre la tasa de pago de ciertas tareas. Por ejemplo, en diciembre la empresa implementó cambios en la sección de ingresos de su panel de control para los colaboradores, con desgloses más granulares de los pagos y el historial laboral.
“Como muchas otras empresas tecnológicas, cuando se atraviesan períodos de rápido crecimiento, hay ciertas partes de la plataforma que pueden no estar tan pulidas o maduras como nos gustaría que estuvieran. Y creo que ese es precisamente nuestro caso”, dijo Zhu, invocando el argumento de las grandes tecnológicas sobre los problemas de crecimiento. “Hemos experimentado un crecimiento tremendo en el último año y, aunque seguimos invirtiendo en la infraestructura para mejorar la fiabilidad de la plataforma, sin duda hay áreas en las que debemos mejorar continuamente”.
O’Neil dijo que ha visto a gente quejarse de Outlier en Reddit, pero desestima las críticas. «No sé cómo decirlo de forma agradable, pero [los que se quejan] piensan que valen más de lo que valen, en cierto sentido», dijo. «Sé que es una forma un poco grosera de decirlo». Dijo que aprecia la flexibilidad y el dinero que le brinda el programa. Gracias a los ingresos, ha podido llevar a su familia de vacaciones a Pensacola Beach en Florida. Hart ha utilizado el dinero para enviar a su hija a un campamento espacial.
“Les genera una enorme ansiedad intentar trabajar constantemente bajo un látigo metafórico”.
Glenn Danas, socio, bufete de abogados Clarkson
Steve McKinney, contratista de California y demandante en dos de las demandas, dijo a Forbes en una declaración que Outlier le costó la salud mental, ya que él y otros contratistas se enfrentaron a contenido «atroz» para hacer que el modelo de lenguaje que entrenó fuera más seguro y se sintiera más humano. En la demanda, afirma que solo le pagaron una parte de su tarifa de 25 dólares por hora por exceder los límites de tiempo para tareas complicadas que requerían un tiempo «mucho más allá del previsto». «Es exasperante y repugnante ver a Scale AI engañando a los trabajadores sobre su compensación y lucrando a costa de personas que luchan por llegar a fin de mes».
Glenn Danas, socio de Clarkson Law Firm, con sede en Malibú, que representa a McKinney y otros trabajadores de Outlier, dijo que el problema principal son las limitaciones de tiempo de Outlier. La presión ha aumentado aún más a medida que la plataforma se acerca más a los trabajadores altamente calificados, dijo. «Especialmente las personas que están educadas y son expertas en diferentes áreas, realmente quieren hacer un buen trabajo en cualquier cosa para la que las contraten», dijo a Forbes . «Les está generando una enorme cantidad de ansiedad intentar trabajar constantemente bajo un látigo metafórico».
Scale negó haber cometido irregularidades en relación con las limitaciones de tiempo y la remuneración. “Les proporcionamos a los trabajadores una estimación de cuánto tiempo se espera que duren las tareas y la remuneración se describe y acuerda claramente antes de que el colaborador comience a trabajar”, dijo un portavoz, alegando que la empresa establece límites de tiempo más largos que sus estimaciones de cuánto tiempo debería durar una tarea.
La empresa agregó: “Para apoyar a los colaboradores que realizan este importante trabajo, contamos con numerosas medidas de seguridad, incluido un aviso previo sobre la naturaleza sensible del trabajo, la posibilidad de darse de baja en cualquier momento y acceso a programas de salud y bienestar”.
O’Neil y Hart dijeron que no reconocieron los problemas planteados en las demandas (las entrevistas con los dos contratistas fueron organizadas por Scale y a ellas asistió uno de sus empleados de comunicaciones). Dijeron a Forbes que no se sienten presionados por los límites de tiempo de Outlier y que el contenido con el que han trabajado no ha sido abrumador ni difícil de manejar.
“No hay nada demasiado complicado que no haya podido manejar”, dijo O’Neil. “Trabajo en el sector de la plomería. Es un negocio completamente diferente”.