En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Glossaire
Online Learning
Définition iA

Online Learning

L’apprentissage en ligne est une méthode d’intelligence artificielle où un modèle est mis à jour en temps réel à mesure que de nouvelles données arrivent. Contrairement à l’apprentissage batch, il n’est pas nécessaire de réentraîner l’algorithme sur l’ensemble du jeu de données.

Contexte
Cette approche est particulièrement adaptée aux environnements où les données évoluent rapidement ou arrivent en flux continu, comme les systèmes financiers, la cybersécurité ou la recommandation en ligne. Elle permet aux modèles de s’adapter immédiatement aux changements (phénomène de concept drift).

Exemples d’utilisation

  • Détection de fraude : mise à jour instantanée d’un modèle quand une transaction suspecte est observée.
  • Publicité en ligne : adaptation dynamique aux clics récents des utilisateurs.
  • IoT : traitement en continu de données issues de capteurs industriels.

Avantages et limites

  • ✅ Réactivité face aux nouvelles données.
  • ✅ Utilisation efficace de la mémoire (pas besoin de stocker tout l’historique).
  • ❌ Risque d’instabilité si les données sont trop bruitées.
  • ❌ Plus complexe à valider que l’apprentissage batch.

Un concept clé de l’apprentissage en ligne est le compromis entre stabilité et plasticité. La stabilité permet de conserver les connaissances acquises à partir de données passées, tandis que la plasticité offre la capacité de s’adapter rapidement à de nouveaux motifs. Trouver le bon équilibre est essentiel : un modèle trop plastique risque d’oublier des informations précieuses à long terme (oubli catastrophique), alors qu’un modèle trop stable risque de ne pas réagir suffisamment vite aux changements soudains.

Différents algorithmes ont été conçus spécifiquement pour l’apprentissage en ligne. La descente de gradient stochastique (SGD) en version incrémentale est l’approche la plus répandue, les poids du modèle étant mis à jour à chaque nouvel exemple. Des méthodes plus avancées, comme les algorithmes passif-agressif ou les techniques de fenêtre adaptative (Adaptive Windowing), ajustent dynamiquement leur stratégie d’apprentissage en fonction du flux de données, garantissant à la fois réactivité et robustesse.

L’évaluation des modèles en ligne pose également des défis spécifiques. Contrairement à l’apprentissage batch, où l’on calcule des métriques sur un jeu de test fixe, l’apprentissage en ligne nécessite souvent une évaluation préquentielle : chaque nouvelle donnée est d’abord prédite, puis utilisée pour mettre à jour le modèle. Cette méthode rend la validation plus complexe mais reflète mieux les conditions réelles.

Enfin, l’apprentissage en ligne se développe dans de nombreux domaines. Dans la conduite autonome, il permet aux véhicules de s’adapter en temps réel à des conditions de circulation changeantes. En santé personnalisée, les objets connectés fournissent des flux continus de données patient, permettant d’ajuster immédiatement les recommandations. Ces usages montrent comment l’apprentissage en ligne transforme l’intelligence artificielle d’un processus statique en un paradigme dynamique et adaptatif.

📚 Références

  • Bifet, A., & Gavaldà, R. (2007). Learning from Time-Changing Data with Adaptive Windowing.