En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Glossaire
Zero-Shot Learning
Définition iA

Zero-Shot Learning

Le Zero-Shot Learning (ZSL) est une approche émergente de l’intelligence artificielle qui bouleverse les méthodes classiques d’entraînement. Contrairement aux modèles traditionnels, qui doivent être exposés à un grand volume de données annotées pour chaque tâche ou chaque classe, le ZSL permet à un modèle d’exécuter correctement une tâche ou de reconnaître une classe qu’il n’a jamais vue lors de son entraînement initial.

L’idée fondamentale repose sur l’exploitation de descriptions sémantiques et de représentations vectorielles partagées entre différentes modalités (texte, image, concepts). Plutôt que d’avoir besoin d’exemples annotés pour chaque nouvelle catégorie, le modèle s’appuie sur les relations entre le langage et les données. Par exemple, si un modèle a appris à reconnaître un chat et un chien, il peut identifier un renard en se basant uniquement sur une description textuelle (“animal de taille moyenne, à fourrure rousse, proche du chien et du loup”).

Comment fonctionne le Zero-Shot Learning ?

Le Zero-Shot Learning s’appuie sur deux piliers :

  1. Les représentations vectorielles : les données (images, textes, sons) et les descriptions des classes sont projetées dans un espace commun où les relations de similarité peuvent être mesurées.
  2. Le raisonnement sémantique : le modèle établit des liens entre ce qu’il connaît déjà et ce qui lui est demandé, en exploitant les définitions ou les consignes formulées en langage naturel.

Cette approche est rendue possible grâce aux grands modèles de langage (LLMs) et aux architectures multimodales comme CLIP (OpenAI), capables d’associer une image et sa description textuelle dans le même espace latent.

Applications du Zero-Shot Learning

Le Zero-Shot Learning connaît de nombreuses applications concrètes :

  • Vision par ordinateur : reconnaître des objets rares ou nouveaux dans des images, sans devoir constituer un dataset spécifique pour chaque catégorie.
  • Traitement automatique du langage naturel (NLP) : classer des textes, analyser des sentiments ou répondre à des questions en suivant simplement une consigne formulée en langage naturel.
  • Recherche d’information : effectuer une recherche plus intelligente en reliant la requête utilisateur (mots-clés ou phrases) à des contenus qui n’ont pas été explicitement associés pendant l’entraînement.
  • Sécurité et détection d’anomalies : identifier des comportements suspects ou des événements imprévus en s’appuyant sur des descriptions de ce qui doit être considéré comme “anormal”.

Atouts et limites

Le principal avantage du Zero-Shot Learning est qu’il réduit la dépendance aux données annotées, souvent coûteuses et longues à produire. Cela en fait une solution particulièrement intéressante dans des domaines où les classes sont nombreuses, changeantes ou difficiles à définir à l’avance (cybersécurité, médecine, détection de fraudes, etc.).

Cependant, le ZSL présente aussi des limites. Sa performance dépend fortement de la qualité des descriptions sémantiques fournies et de la richesse des représentations apprises en amont. Si les relations linguistiques ou conceptuelles sont imprécises, le modèle risque de mal interpréter les nouvelles classes.

Conclusion

Le Zero-Shot Learning représente une étape cruciale vers des systèmes d’intelligence artificielle plus flexibles et plus proches du raisonnement humain. Il illustre la tendance actuelle de l’IA à s’appuyer davantage sur le langage naturel et les relations sémantiques que sur des volumes massifs de données. Pour en savoir plus sur ses mécanismes et applications, vous pouvez consulter l’article détaillé d’Innovatiana : https://www.innovatiana.com/en/post/zero-shot-learning-in-ai