En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Impact Sourcing

El etiquetado de datos es una profesión, no un trabajo ocasional

Escrito por
Aïcha
Publicado el
2023-07-10
Tiempo de lectura
0
min

[Fuente en la que se basa nuestro artículo: Inteligencia artificial de aprendizaje profundo: The Batch, número 204 - https://www.deeplearning.ai/the-batch/issue-204/]

💡 En un enfoque de la IA centrado en los datos, el desarrollo de productos de IA exitosos depende de conjuntos de datos anotados con precisión

Sin embargo, la naturaleza exigente del trabajo de etiquetado de datos y los costos asociados con la anotación de datos a gran escala alientan a las empresas a buscar soluciones para automatizar el trabajo de anotación o a utilizar proveedores independientes con bajos salarios. Estas etiquetadoras de datos, que suelen obtenerse a través de plataformas como Amazon Mechanical Turk o Upwork, tienen una gran demanda y, a veces, tienden a apresurar el trabajo para respetar la Plazos reglas estrictas que se les imponen o que deben abandonarse. Sin embargo, Todos se beneficiarían de ver la anotación de datos menos como un trabajo ocasional o un «trabajo ocasional» y más como una profesión por derecho propio..

¿Cómo funciona el sector de la anotación de datos?

Las empresas que prestan servicios para la provisión de anotadores (o etiquetadores de datos), como Centaur Labs, Surge AI, Remotasks o Outlier (que pertenecen a Scale AI) y muchos otros actores importantes del sector, utilizan sistemas de Colaboración colectiva automatizada o manual para gestionar a los trabajadores autónomos en todo el mundo. Los etiquetadores de datos autónomos deben aprobar exámenes de calificación, recibir capacitación y ser evaluados regularmente para realizar tareas como «trazar» caja delimitadora «en imágenes o videos, la clasificación de los sentimientos expresados en las publicaciones en las redes sociales, la evaluación de los videoclips sexuales en algunos casos, la clasificación de las transacciones bancarias o la evaluación de las respuestas de Chatbots.

Desafíos relacionados con la estabilidad de los puestos de trabajo y los salarios de los etiquetadores de datos independiente

La escala salarial de los etiquetadores de datos varía considerablemente según la ubicación de los trabajadores y la tarea que se les asigne, y oscila entre 1 dólar por hora en Kenia y 25 dólares por hora o más en los Estados Unidos. Algunas tareas que requieren conocimientos funcionales o especializados, un juicio fundamentado o una cantidad significativa de trabajo pueden remunerarse hasta 300 dólares por microtarea.

Además, este trabajo generalmente no es muy estable y no tiene en cuenta la legislación laboral: si una etiquetadora de datos se ausenta un día para ir al médico o es víctima de un corte de energía o conexión a Internet, es reemplazada inmediatamente por el sistema de Colaboración colectiva. Además, este sistema no tolera los momentos de fatiga o los problemas temporales de rendimiento: ¡unos pocos errores de más y es el final del contrato de la etiquetadora de datos!

Al considerar el etiquetado de datos como una tarea simple y accesible para todos, las empresas buscan reducir los costos drásticamente hasta negociar tarifas por hora indecentes. Si utiliza una solución mar adentro suele ser una buena idea para reducir los costes, no se equivoque: no es posible obtener un servicio de calidad que respete los derechos humanos fundamentales al mismo tiempo por menos de 5 euros por hora (¡lo que ya es muy bajo!) para una etiquetadora de datos, independientemente de si se encuentra en la India, Filipinas o Madagascar.

Lamentablemente, este sistema establecido es demasiado impersonal en la actualidad: para proteger los secretos comerciales de sus clientes, las empresas asignan tareas sin revelar a los etiquetadores de datos la identidad de su cliente, la aplicación o la función en cuestión. Los etiquetadores de datos desconocen el propósito de las anotaciones que producen y se comprometen a no hablar de su trabajo. El resultado es una pérdida de significado y conjuntos de datos de mala o mala calidad... ¡lo que no es ideal para la formación de modelos!

Desafíos relacionados con las instrucciones impartidas a los etiquetadores de datos y su formación

Las instrucciones para las tareas de etiquetado suelen estar muy mal documentadas y son ambiguas. Por ejemplo, estas tareas pueden requerir la anotación de la ropa que llevan los seres humanos, lo que excluye la ropa que aparece en una foto de una muñeca o un personaje de dibujos animados. Pero, ¿qué pasa con las imágenes de ropa reflejadas en un espejo? ¿Y la armadura cuenta como ropa? ¿Y máscaras de snorkel? A medida que los científicos de datos y los desarrolladores revisan sus modelos, las reglas para anotar datos se vuelven cada vez más complejas, lo que obliga a los anotadores a tener en cuenta una variedad cada vez mayor de excepciones y casos especiales. Ante el primer error o descuido, ¡los etiquetadores de datos corren el riesgo de perder sus puestos de trabajo! Con mucha frecuencia, sus clientes no se esforzaban por documentar con precisión los casos particulares o atípicos, las excepciones o los posibles problemas de calidad de los datos del conjunto inicial. En muchos casos, no es posible entablar ninguna conversación entre el cliente y el etiquetador de datos independiente, que se encuentra en dificultades y termina abandonando su trabajo, incluso si eso significa que no se le paga por el trabajo ya realizado en la plataforma de Colaboración colectiva. ¡Es una aberración!

Desafíos relacionados con las condiciones de trabajo, los horarios y la incertidumbre de las microtareas para anotar datos

En el mundo del etiquetado de datos, los horarios de trabajo suelen ser esporádicos e impredecibles. Los trabajadores no saben cuándo va a llegar la próxima tarea, cuánto durará, si será interesante o abrumadora, o si estará bien o mal remunerada. Esta incertidumbre, combinada con la brecha entre su salario por hora y los ingresos de sus empleadores, según informa la prensa, puede desmoralizar a los trabajadores.

Muchos anotadores lidian con el estrés reuniéndose en secreto en WhatsApp para compartir información y pedir consejos sobre cómo encontrar tareas interesantes y cómo evitar el trabajo que consideran no deseado. Aprenden consejos, como utilizar los modelos de inteligencia artificial existentes para realizar las tareas más sencillas, conectarse a través de servidores proxy para ocultar su ubicación y crear varias cuentas para protegerse de la suspensión si infringen las normas establecidas por las empresas que les ofrecen trabajo.

La importancia de la profesión de etiquetador de datos y la anotación de datos de calidad

El desarrollo de sistemas de IA exitosos depende de datos anotados con precisión. Sin embargo, las estrictas restricciones financieras que supone la anotación a gran escala alientan a las empresas a utilizar las soluciones más baratas del mercado y a optar por la tarifa por hora más baja, independientemente de la calidad de los datos producidos, de la ética de la cadena de suministro basada en la IA o del volumen de horas que dediquen a las etiquetadoras de datos. Aun así, todo el mundo se beneficiaría de ver la anotación de datos menos como un trabajo ocasional y más como una profesión por derecho propio.

El valor de los etiquetadores de datos (o anotadores) cualificados es cada vez más evidente a medida que los profesionales de la IA adoptan prácticas de desarrollo centradas en los datos que permiten crear sistemas eficaces con relativamente pocos ejemplos. Con muchos menos ejemplos, seleccionarlos y anotarlos adecuadamente es absolutamente fundamental.

📣 El etiquetado manual de los datos es un proceso que se considera laborioso, a veces ingrato. En realidad, valorar este trabajo constituye la la mejor manera de crear conjuntos de datos de calidad para entrenar los modelos de IA. Con Innovatiana, ofrecemos experiencia, una fuerza laboral calificada y controles automatizados para gestionar las necesidades de datos a escala. El talento está en todas partes. No las oportunidades. Queremos contribuir a reparar esta injusticia creando puestos de trabajo en Madagascar, con salarios justos y condiciones de trabajo éticas.


Aicha CAMILLE JO, CEO de Innovatiana.