ROC & AUC Curve
La curva ROC (Receiver Operating Characteristic) es una representación gráfica que mide el rendimiento de los modelos de clasificación. Muestra la relación entre la tasa de verdaderos positivos (sensibilidad) y la tasa de falsos positivos (1 – especificidad) para distintos umbrales de decisión. El AUC (Área Bajo la Curva) resume este rendimiento: cuanto más se acerque a 1, mejor será la capacidad del modelo para discriminar entre clases; un valor de 0,5 refleja predicciones aleatorias.
Ejemplos prácticos
- Sanidad: evaluar un test de diagnóstico de VIH, COVID-19 u otras enfermedades.
- Banca y seguros: medir la eficacia de un sistema de detección de fraude.
- Ciencia de datos: comparar clasificadores en competiciones y benchmarks.
Ventajas y limitaciones
- ✅ Permite evaluar modelos sin depender de un único umbral.
- ✅ Funciona bien incluso con clases desbalanceadas.
- ❌ Puede perder significado cuando hay un desbalance extremo.
- ❌ No refleja directamente el impacto económico o social de los errores.
La curva ROC se ha convertido en un estándar de referencia en la evaluación de clasificadores binarios, ya que permite observar cómo varía la sensibilidad frente a la tasa de falsos positivos al ajustar el umbral. Esto resulta clave en entornos como el diagnóstico médico o la detección de fraudes, donde no siempre existe un único punto de corte ideal.
No obstante, su uso exclusivo puede llevar a interpretaciones equivocadas. En datasets desbalanceados, un modelo puede mostrar una curva ROC aparentemente “buena” aunque su rendimiento real en la clase minoritaria sea deficiente. Por ello, en estos escenarios es recomendable acompañarla con la curva Precisión–Recall.
El valor de AUC resume el rendimiento global, pero no sustituye un análisis detallado. En aplicaciones críticas, como oncología o seguridad financiera, interesa evaluar cómo se comporta el modelo en rangos específicos de sensibilidad o especificidad. Así, la curva ROC es una guía poderosa, pero debe interpretarse junto a criterios de negocio y riesgo para tomar decisiones fiables.
📚 Referencias
- Fawcett, T. (2006). An Introduction to ROC Analysis.
- Hastie, T., Tibshirani, R., Friedman, J. (2009). The Elements of Statistical Learning.