Feature Map
Dans un réseau de neurones convolutif (CNN), une feature map (ou carte de caractéristiques) est la représentation intermédiaire générée après l’application de filtres (ou convolutions) sur une image d’entrée. Elle met en évidence des motifs spécifiques comme des bords, des textures ou des formes, selon la profondeur de la couche.
Contexte et rôle
Les CNN fonctionnent en couches successives : les premières extraient des informations simples (par exemple, les contours), tandis que les couches plus profondes capturent des structures complexes (comme un œil, une roue ou une lettre). Chaque feature map reflète donc ce que le réseau “perçoit” à un certain niveau d’abstraction.
Applications
- Vision par ordinateur : détection d’objets, reconnaissance faciale, classification d’images.
- Santé : analyse d’IRM ou de radiographies, où les feature maps révèlent des anomalies.
- Interprétabilité : visualiser les cartes de caractéristiques aide à comprendre comment un modèle prend ses décisions.
Avantages et limites
- Avantage : elles rendent le fonctionnement des CNN plus interprétable.
- Limite : leur visualisation reste complexe, et leur interprétation nécessite une expertise.
Une feature map (ou carte de caractéristiques) peut être vu comme une traduction intermédiaire des données : chaque filtre de convolution “réagit” à certains motifs et produit une carte indiquant leur présence et leur intensité.
L’intérêt des feature maps réside dans leur organisation hiérarchique. Les couches initiales extraient des éléments simples (bords, contrastes), tandis que les couches profondes révèlent des structures complexes comme des objets entiers ou des visages. Cette progression graduelle explique l’efficacité des CNN pour l’analyse d’images.
Sur le plan pratique, l’étude des cartes de caractéristiques est devenue un outil d’explicabilité. Visualiser ces représentations permet de vérifier si le réseau se concentre sur les bonnes zones (par exemple une tumeur dans une image médicale). Toutefois, leur interprétation reste délicate et requiert une solide expertise, car les activations peuvent être difficiles à relier à des concepts humains intuitifs.
Références
- Goodfellow et al., Deep Learning (MIT Press, 2016).