Inteligencia artificial: imposible sin mercado laboral esclavista.
La perversa explotación de los etiquetadores de datos
Podría ser anecdótico lo que contaba el MIT, en español, sobre el etiquetado de datos en Venezuela o Kenia, en abril de este año. Una multitud de startups estadounidenses habían surgido en Silicon Valley, como subcontratistas de las grandes tecnológicas, para hacerles no solo el trabajo sucio, sino el más sucio de todos: aprovecharse de países pobres para imponer condiciones laborales terribles. Los venezolanos eran en ese momento los más expuestos, su situación había empeorado, Kenia solo mantenía las malas condiciones de partida. Ahora se conocen situaciones análogas también en Sudáfrica. Lo peor de todo, que esta es la base sobre la que está construido el gran desarrollo de la inteligencia artificial. Y me temo que también el motivo de que de pronto estemos viendo explotar sus aplicaciones, generando fotos, vídeos, modelos de plegamiento de proteínas, etcétera. Porque sí, el MIT avisó en 2022, pero hay artículos hablando de lo mismo desde al menos 2019.
Estas startups de etiquetado subcontratadas nunca han dado el salto a la fama, y no lo darán nunca, porque se dedican a un trabajo muy, muy técnico. La noticia es DALL-E porque oye, hace dibujitos muy molones a partir de un texto. Pero cómo vas a convertir en noticia a unos tíos que se dedican a los metadatos. Es más, ¿qué demonios son los metadatos?
Ni más ni menos que la base de la IA, y lo que mejor demuestra que los ordenadores son unas máquinas tontas. No solemos tenerlo en cuenta, pero como computadoras que son solo entienden el mundo a través de un interruptor. Encendido o apagado, blanco o negro. Si tienes que enseñar algo a alguien tan limitado, más vale que esté mascadito. Si tiene que aprender qué es un árbol, tendrás que enseñarle TODOS los tipos de árbol. Si solo le proporcionas árboles de hojas verdes te dirá que un pruno, que las tiene rojas, no es un árbol. Si incluyes fotos del otoño las descartará porque las hojas son amarillas. Si el suelo es de arena desértica y crece una acacia, también la descartará porque no ha visto nunca árboles en los desiertos, debe ser un arbusto. Bueno, no hay problema, en internet hay millones de fotos de árboles, hagamos que las mire todas.
La idea es fantástica, pero tiene un pequeño problema. Toda esa gente que subió fotos de árboles no se molestó en explicarle al ordenador que eran árboles. Las máquinas las entienden como imágenes. Así que necesitamos un humano que las etiquete añadiéndoles la palabra árbol. Tiene que ser rápido, hacerlo a golpe de clic, ser muy productivo generando, si puede ser, cientos de miles de etiquetas a diario. Así que la base del aprendizaje que genera las inteligencias artificiales, basadas en millones de datos, se basan en uno de los trabajos humanos más mecánicos del mundo. Pero claro, eso supone también un coste millonario en salarios, y en la economía digital las inversiones millonarias pueden generar pérdidas equivalentes, como le está sucediendo a Zuckerberg con Meta y su metaverso.
¿Por qué esta explosión de aplicaciones IA, justo ahora?
El covid tuvo mucho que ver. Durante el parón pandémico menudearon las noticias anunciando que el etiquetado de datos era una magnífica oportunidad laboral, que podía hacerse en remoto y que, dada su simplicidad, era accesible para cualquiera que tuviese un ordenador. Funcionó, y ese es en parte el motivo de que dos años después veamos la explosión de aplicaciones IA: se aceleró el etiquetado.
Ejemplos de empresas en Silicon Valley con trabajadores fuera de EEUU.
Scale IA vale 6.850 millones de euros, trabaja para OpenAI (Elon Musk), Toyota Research y Lyft (una de las empresas dedicadas al desarrollo de la conducción autónoma). Compañías similiares son Mechanical Turk, Samasource, y Migthy AI, todas estadounidenses, con todos sus etiquetadores en la India, África subsahariana, y Sudeste de Asia. El sueldo mensual en Samasource, trabajando veinte días, es 160 dólares. La compañía, con 2.912 trabajadores, está valorada en 71,5 millones de dólares.
Subcontratas de subcontratas: empresas en los terceros países.
Fastagger en Kenya, Sebenz.ai en Sudáfrica y Supahands en Malasia se han creado para dar servicio a compañías de Silicon Valley como las citadas en el párrafo anterior. Trabajar en ellas es relativamente fácil, basta saber usar un ratón y un ordenador, pero tienen una pega. Parte del trabajo que realizan no se les paga porque no es válido (errores en el etiquetado, fallos en el sistema, lo que sea). Ahora han empezado a pedir que sean autónomos, o como los denominan en inglés «contratistas independientes», que es tanto como llamar empresario al repartidor de Globo que va en su bicicleta. La labor diaria es monótona y agotadora, pues hay que mantener la atención permanente en la pantalla, permanecer sentado y procurar no hacer pausas para ir al baño, o que sean muy cortas. Por supuesto, sillas ergonómicas soportes para la muñeca o descansos regulares no están contemplados.
Tenemos un problema añadido: bajos salarios es baja calidad
Porqué no tenemos aún coches autónomos. Uno de los motivos es la dificultad del etiquetado de datos de imágenes captadas en calles y carreteras. Requiere tiempo y reflexión dar las etiquetas adecuadas a una paloma posada en el asfalto. Si el etiquetador ha puesto «pájaro»+«ser vivo»+«móvil» el coche reducirá la velocidad, o se detendrá a esperar que se retire. Porque la base de la conducción autónoma es no chocar contra objetos en movimiento. Poniendo en peligro al resto de conductores humanos, que sí saben que las palomas salen volando, no es necesario reducir la velocidad. Hay que esperar al fallo para decir a la subcontrata que etiquete a los pájaros humanos como sacrificables. Momento en que el de marketing grita ¿estáis locos? ¿Queréis que la gente identifique nuestros coches autónomos con la crueldad animal?
Lectura recomendada
Germinal, de Zola, es una novela que puede impresionar vivamente si se tiene un mínimo de empatía hacia las condiciones de los obreros -mineros- de la Revolución Industrial. Es ficción pero el realismo del autor francés la convierte en un documento periodístico de cómo vivía la gente común en un entorno laboral de baja cualificación, y turnos de catorce horas diarias. Hoy podría escribirse una novela análoga con las granjas de etiquetado de datos.
Paradojas ética de la IA: estas imágenes, generadas con Stable Diffusion, recrean imágenes de mineros agotados de tanto trabajar. Ninguno de ellos existe. Pero miles de imágenes equivalentes tuvieron que ser etiquetadas por otros mineros para conseguir esa maravilla, que yo he usado gratis, descargándomelas en minutos.