Sensitivity
La sensibilité est une métrique d’évaluation qui mesure la capacité d’un modèle de classification à identifier correctement les cas positifs. Elle se calcule comme la proportion de vrais positifs détectés parmi l’ensemble des éléments réellement positifs. On l’appelle aussi taux de rappel (recall).
Contexte et importance
La sensibilité est particulièrement critique lorsque l’on souhaite minimiser les faux négatifs, c’est-à-dire éviter de manquer un cas positif. C’est le cas dans de nombreux domaines sensibles : dépistage médical, détection de fraudes, sécurité.
Exemples concrets
- Santé : dans un test de dépistage du cancer, une sensibilité élevée garantit que la majorité des patients malades seront détectés.
- Cybersécurité : un système de détection d’intrusion avec haute sensibilité repère la plupart des attaques, même si cela génère quelques fausses alertes.
- Banque : en détection de fraude, mieux vaut identifier trop de transactions suspectes que de laisser passer des fraudes réelles.
Limites
Une sensibilité très élevée peut se faire au détriment de la spécificité (la capacité à identifier correctement les cas négatifs). Un modèle peut prédire "positif" trop souvent pour ne rien rater, mais générer ainsi beaucoup de faux positifs.
La sensibilité traduit la capacité d’un modèle à identifier correctement les cas positifs. Elle devient primordiale dès que les faux négatifs sont coûteux : un patient malade non détecté, une fraude bancaire non repérée ou une faille de sécurité ignorée.
Un modèle très sensible manquera rarement un cas positif, mais il risque d’émettre davantage de fausses alertes. Par exemple, un test médical trop sensible peut inquiéter de nombreuses personnes en bonne santé, surchargeant les médecins avec des vérifications inutiles.
C’est pourquoi la sensibilité s’interprète toujours en relation avec d’autres mesures comme la spécificité (capacité à reconnaître les négatifs), la précision, ou encore la F-mesure, afin de donner une vision équilibrée des performances du modèle.
📚 Références
- Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters.
- Géron, A. (2019). Apprentissage automatique avec Scikit-Learn, Keras et TensorFlow.