Decision Boundary
La frontera de decisión es la línea (en dos dimensiones) o superficie (en dimensiones superiores) que divide las distintas clases en un problema de clasificación. Define el límite a partir del cual un modelo predice que un dato pertenece a una clase en lugar de otra.
Ejemplo
- En una regresión logística binaria, la frontera suele ser una línea recta.
- En modelos más complejos como redes neuronales o SVM con kernels no lineales, la frontera puede ser curva y con formas complejas.
Aplicaciones
- Visión por computador: distinguir objetos en imágenes.
- Procesamiento de texto: clasificar correos como spam o no spam.
- Biomedicina: separar diagnósticos positivos y negativos.
Importancia
La forma de la frontera refleja la capacidad de generalización del modelo:
- Demasiado simple → underfitting.
- Demasiado compleja → overfitting.
La frontera de decisión funciona como una línea imaginaria que un algoritmo dibuja para separar categorías. Aunque solemos explicarla con ejemplos en dos dimensiones, en la realidad se trata de superficies complejas en espacios de alta dimensionalidad, imposibles de visualizar directamente.
La proximidad a la frontera también tiene un significado práctico: cuando una observación cae muy cerca de ella, el modelo suele estar inseguro. Esto resulta útil en contextos como los sistemas médicos, donde los casos dudosos pueden derivarse a revisión humana en lugar de confiar ciegamente en la predicción automática.
Además, las fronteras de decisión ayudan a comprender cómo evoluciona un modelo con más datos o con regularización. A medida que se entrena, la frontera se ajusta: se suaviza, se desplaza o se vuelve más precisa. Analizar estos cambios permite entender si el modelo está aprendiendo patrones reales o si simplemente memoriza el conjunto de entrenamiento.
Referencia
- Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.