Generative Adversarial Network (GAN)
Un GAN (Generative Adversarial Network) est un modèle d’intelligence artificielle introduit en 2014 par Ian Goodfellow et ses collègues. Il repose sur l’idée d’opposer deux réseaux neuronaux :
- Le générateur crée des données synthétiques (images, sons, textes).
- Le discriminateur évalue si les données proviennent du générateur ou du jeu de données réel.
Ce processus compétitif améliore progressivement la qualité des données générées.
Applications
- Images réalistes : visages humains inexistants mais indiscernables de vrais portraits.
- Art et design : génération d’œuvres originales et styles hybrides.
- Jeux vidéo : création de textures et environnements immersifs.
- Santé : génération de données médicales synthétiques pour l’entraînement de modèles sans compromettre la confidentialité.
Enjeux
- Éthiques : deepfakes et désinformation.
- Techniques : instabilité de l’entraînement, effondrement de mode (mode collapse).
- Réglementaires : usage conforme au RGPD et à l’AI Act.
L’un des aspects les plus fascinants des GAN réside dans leur capacité à capturer des distributions complexes et multidimensionnelles sans recourir à un modèle probabiliste explicite. Cela en fait des outils puissants pour l’apprentissage non supervisé, puisque le générateur apprend la structure sous-jacente des données en étant constamment « challengé » par le discriminateur.
De nombreuses variantes de GAN ont été développées pour répondre à différents défis. Les GAN conditionnels (cGAN) permettent de générer des données guidées par des étiquettes spécifiques (par exemple, créer des images de chaussures d’une certaine couleur). Les CycleGAN rendent possible la traduction d’images entre domaines sans exemples appariés, comme transformer des paysages d’été en paysages d’hiver. Les StyleGAN, quant à eux, sont devenus célèbres pour leur capacité à produire des visages humains extrêmement réalistes.
Malgré ces avancées, l’entraînement des GAN reste difficile. Des problèmes comme le mode collapse, où le générateur produit un nombre limité de variantes, ou encore l’instabilité de convergence, demeurent des sujets de recherche actifs. Des techniques telles que les Wasserstein GAN (WGAN) ou la normalisation spectrale ont été proposées pour améliorer la stabilité et la diversité des échantillons générés.
Au-delà des usages créatifs, les GAN ont un potentiel dans des domaines sensibles. En santé, ils permettent de créer des images médicales synthétiques qui préservent la confidentialité des patients tout en facilitant l’entraînement de modèles. En cybersécurité, ils sont étudiés pour simuler des scénarios d’attaque et renforcer les défenses. Ces applications démontrent la polyvalence des GAN mais rappellent aussi la nécessité d’un encadrement éthique rigoureux.
📚 Sources : Goodfellow et al. (2014), CNIL (2023).