En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Data Labeling

Quels sont les impacts de l’IA et de l’industrie du Data Labeling ?

écrit par
Nicolas
Temps de lecture
This is some text inside of a div block.
min

Les Data Annotation Services : une nécessité pour qui veut développer des produits IA ?

L'intelligence artificielle (IA) est devenue un sujet de discussion de plus en plus présent dans notre société ces dernières années. Récemment, vous avez probablement testé ChatGPT, d'OpenAI, qui vous a bluffé(e). Pourtant, selon l'article "AI Isn't Artificial or Intelligent" publié par Vice, l'IA n'est ni artificielle ni intelligente dans le sens où nous l'entendons habituellement.

Il faut dire que l'IA est en réalité un outil créé par l'homme pour accomplir des tâches spécifiques. Elle n'a pas de conscience ni de volonté propre, et ne peut pas être considérée comme une "entité intelligente" à part entière. En effet, l'IA est simplement programmée pour suivre les instructions qu'on lui donne, et ne peut pas réfléchir de manière autonome ou prendre des décisions de manière indépendante. Bref – c’est un programme informatique comme un autre !

Malgré cela, l'IA peut avoir un impact considérable sur notre société et nos vies quotidiennes. Elle peut être utilisée pour automatiser certaines tâches, ce qui peut entraîner une réduction des coûts et une augmentation de l'efficacité dans les entreprises. Elle peut également être utilisée pour analyser de grandes quantités de données et prendre des décisions basées sur ces données, ce qui peut être utile dans les domaines de la santé ou de la finance, par exemple.

Des problèmes sociaux et éthiques dans l'externalisation des tâches d'annotation d'images ?

Il est important de noter que l'IA peut aussi entraîner des problèmes sociaux et éthiques. Par exemple, l'automatisation de certaines tâches peut entraîner la suppression de certains emplois, ce qui peut avoir des conséquences sur les travailleurs et leur mode de vie. Il est donc important de réfléchir à la façon dont l'IA peut être utilisée de manière responsable, équitable et éthique, afin de minimiser les risques potentiels pour les individus et la société. Il faut toutefois minimiser ce que l'on entend parfois sur l'IA ("l'intelligence artificielle va supprimer nos emplois, demain je serai obsolète !") : avec l'IA, des métiers qui n'existent pas aujourd'hui vont émerger et vont créer autant d'opportunités partout dans le monde.

Quels impacts pour l'industrie du Data Labeling Outsourcing ?

Le Data Labeling est un processus crucial dans le domaine de l'intelligence artificielle (IA). Cela consiste à étiqueter les données en vue de leur utilisation dans un modèle d'IA. Le crowdsourcing est de plus en plus utilisé pour produire de telles tâches de labellisation de données dans des délais courts. C’est la tendance dominante de ce marché. Mais qu'est-ce que le crowdsourcing et comment peut-il avoir un impact sur l'IA ?

Le crowdsourcing n'est pas un nouveau concept : il s'agit tratégie de collec presque aussi ancienne qu'Internet, qui consiste à s'appuyer sur la contribution de nombreux individus pour résoudre un problème ou réaliser une tâche. Cela peut se faire en ligne, via des plateformes dédiées, ou en utilisant des méthodes traditionnelles comme des sondages. Le crowdsourcing a été largement popularisé avec des plateformes comme Wikipedia, qui ont permis à des milliers de contributeurs de partager leurs connaissances sur un sujet donné.

Le crowdsourcing peut être un moyen efficace de rassembler des idées, des connaissances et des ressources pour accomplir des tâches qui seraient difficiles ou coûteuses à réaliser de manière traditionnelle. Appliqué à l'Intelligence Artificielle, il s'agit de rassembler des dizaines ou centaines de Data Labelers, généralement non formés et issus de pays à faible revenu, pour les inviter à travailler sur un cas d'usage (par exemple : labelliser 5000 images de véhicules selon des critères précis). Cette approche comporte de nombreux aspects négatifs, avec un impact social et éthique et une précarisation des conditions de travail de nombreuses personnes. En voici un aperçu :

Une exploitation des travailleurs (Data Labelers ou spécialistes du Data Labeling)

Un des principaux problèmes du crowdsourcing est qu'il peut conduire à une exploitation des travailleurs, notamment dans les pays à faible revenu. Certaines plateformes de crowdsourcing proposent des tâches à réaliser en échange d'une rémunération, mais cette rémunération peut être très faible et ne reflète pas la valeur réelle du travail effectué. Il peut y avoir un véritable décalage entre le travail réalisé par les équipes de Data Labelers et la faible rémunération perçue. De plus, ces plateformes peuvent ne pas offrir de stabilité, de protections sociales ou de droits aux travailleurs, ce qui peut entraîner une précarisation de leur situation.

Un impact négatif sur la diversité et l’inclusion… et des modèles IA biaisés

Le crowdsourcing peut également avoir un impact négatif sur la diversité et l'inclusion. En effet, certaines plateformes de crowdsourcing peuvent être dominées par certaines populations, ce qui peut entraîner un biais dans les tâches proposées et dans la façon dont elles sont réalisées. Cela peut avoir des conséquences néfastes pour les populations marginalisées ou sous-représentées, qui peuvent être exclues de ces processus de collaboration.

La diffusion de fake news

Enfin, le crowdsourcing peut être utilisé de manière abusive pour diffuser de fausses informations ou des idéologies dangereuses. En effet, la participation de nombreuses personnes peut donner l'impression de l'existence d'un consensus sur un sujet donné, alors qu'il peut s'agir de fausses informations ou d'une manipulation. Cela peut avoir des conséquences graves sur la vie des populations, notamment en ce qui concerne la santé ou la sécurité.

Faut-il se passer des services d'annotation de données pour l'IA ?

La réponse est "non" ! Il existe aujourd'hui des solutions éthiques qui permettent de labelliser des données de façon éthique sur toute la chaîne de production (du sourcing jusqu'à l'alimentation des modèles avec des données annotées).

Le Data Labeling peut être un processus long et fastidieux, mais il est essentiel pour garantir l'efficacité de l'IA. Si les données sont mal étiquetées ou inexactes, cela peut entraîner des résultats erronés et une perte de confiance dans l'IA. C'est pourquoi il est important de veiller à ce que le Data Labeling soit effectué de manière rigoureuse et professionnelle… en associant, de façon éthique, l’ensemble des travailleurs impliqués dans la chaîne de construction d’un produit IA.

"Nous devons réfléchir sérieusement à la main-d'œuvre humaine qui se trouve dans la Supply Chain de l'IA. Cette main-d'œuvre mérite d'être formée, soutenue et rémunérée pour être prête à faire un travail important que beaucoup pourraient trouver fastidieux ou trop exigeant"

Citation de Mary L. Gray et Siddharth Suri, auteurs du livre "Ghost Work : How to Stop Silicon Valley from Building a New Global Underclass", dans un article publié en 2017 dans la Harvard Business Review.

Externaliser des travaux de Data Labeling dans un pays à faible revenu est une responsabilité : nous en avons bien conscience chez Innovatiana. Nous mettons en œuvre des moyens pour mettre l’humain et l’éthique au cœur de vos efforts IA ! Il est essentiel de veiller à ce que les Data Labelers soient rémunérés de manière juste et à ce que les processus soient inclusifs et ne diffusent pas de fausses informations ou des contenus biaisés.