En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Glossaire
Généralisation
Définition iA

Généralisation

La généralisation désigne la capacité d’un modèle d’intelligence artificielle à produire des prédictions fiables sur des données nouvelles, différentes de celles utilisées pour son entraînement. Autrement dit, un modèle bien généralisé ne « mémorise » pas simplement ses données d’apprentissage, mais apprend des motifs et des structures sous-jacentes qu’il peut réappliquer dans d’autres contextes.

Exemple concret
Un système de reconnaissance d’images qui a appris à identifier des chiens à partir de milliers de photos doit être capable de reconnaître un chien sur une photo qu’il n’a jamais vue, même si l’animal est dans une nouvelle posture ou sous un autre éclairage.

Enjeux

  • Un modèle qui généralise mal peut tomber dans le surapprentissage (overfitting) ou le sous-apprentissage (underfitting).
  • La capacité de généralisation est souvent mesurée grâce à la séparation d’un jeu de test indépendant.
  • En recherche, l’amélioration de la généralisation implique des techniques comme la régularisation (L1/L2), le dropout, ou encore l’augmentation de données.

La généralisation peut se comprendre comme la capacité d’un modèle à « sortir du connu ». Un modèle qui généralise bien n’a pas seulement appris par cœur, il a capté les structures profondes qui expliquent les données.

Dans la pratique, les problèmes de sous-apprentissage et de surapprentissage reflètent deux extrêmes. Le premier conduit à un modèle trop simple, incapable de saisir les régularités ; le second engendre un modèle trop complexe qui reproduit les bruits et anomalies du jeu d’entraînement.

Pour améliorer la généralisation, on combine plusieurs leviers : disposer de données diversifiées, introduire des contraintes via la régularisation (L1, L2, dropout), et valider les choix grâce à la validation croisée. Dans des secteurs sensibles comme la santé ou la justice, la généralisation devient un enjeu de confiance : un modèle qui échoue face à de nouvelles données met en péril son adoption.

Sources :

  • Goodfellow, Bengio & Courville, Deep Learning (2016).
  • CNIL (2023), Comprendre les modèles d’IA.