True Positive Rate
Le taux de vrais positifs (TVP), également appelé sensibilité ou rappel, mesure la capacité d’un modèle de classification à identifier correctement les cas positifs. Il correspond à la proportion d’exemples réellement positifs que le modèle a classés comme tels.
Exemple simple
Si un test médical doit détecter une maladie et qu’il identifie 90 malades sur 100, son TVP est de 90 %.
Pourquoi c’est important
Dans les jeux de données déséquilibrés (par exemple, 99 % de transactions normales contre 1 % frauduleuse), la précision globale n’a que peu de valeur. Ce qui compte, c’est la capacité du modèle à détecter les cas rares mais critiques. Le TVP devient alors une métrique incontournable.
Applications
- Médecine : dépistage du cancer, détection de maladies rares.
- Banque/assurance : repérage des fraudes ou des risques élevés.
- Cybersécurité : identification de comportements suspects.
Limites et compromis
Un TVP élevé peut s’accompagner d’un grand nombre de faux positifs. Cela entraîne une charge supplémentaire : plus de dossiers à vérifier, plus d’alertes fausses. L’évaluation doit donc être complétée par d’autres mesures comme la précision, le score F1 ou la spécificité.
Le TPR ne doit pas être interprété isolément. Dans les systèmes critiques comme la santé ou la cybersécurité, il est souvent complété par des mesures complémentaires telles que la spécificité (True Negative Rate) ou la valeur prédictive positive. Cette combinaison permet d’évaluer non seulement la capacité à détecter les cas positifs, mais aussi à éviter les fausses alertes.
Un autre aspect essentiel est la calibration du seuil de décision. Selon l’usage, un modèle peut privilégier un TPR très élevé (par exemple, dépistage de maladies graves) quitte à tolérer davantage de faux positifs, ou au contraire rechercher un équilibre plus strict pour éviter une surcharge d’alertes.
Dans le monde industriel, l’optimisation du TPR passe aussi par la gestion de données déséquilibrées. Des techniques comme le suréchantillonnage (SMOTE), le sous-échantillonnage ou l’entraînement avec des coûts différenciés aident à corriger la tendance naturelle des modèles à négliger les classes rares.
Enfin, le TPR est un indicateur clé dans la communication entre experts techniques et décideurs. Il offre une mesure intuitive : « combien de cas positifs avons-nous détectés ? », ce qui permet d’aligner les performances d’un modèle avec les attentes métiers.
📚 Références
- Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
- LeCun, Y., Bengio, Hinton (2015). Deep Learning. Nature.