Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Glosario
Outlier
Definición de IA

Outlier

En un conjunto de datos siempre esperamos que los valores sigan un patrón. Pero de repente aparece algo extraño: un registro de temperatura de 200 °C cuando el resto está entre 18 y 25, o una transacción bancaria cien veces mayor que las demás. A eso se le llama outlier o valor atípico.

En inteligencia artificial, estos valores son un reto. Un solo dato atípico puede alterar el entrenamiento de un modelo, inclinando una predicción o generando un sesgo. Sin embargo, no siempre son “errores”: a veces son la pista más interesante. En finanzas, permiten descubrir fraudes; en medicina, detectar una anomalía en un paciente; en industria, anticipar una avería antes de que ocurra.

La dificultad está en decidir qué hacer: ¿eliminarlos, transformarlos, o estudiarlos aparte? El etiquetado como outlier depende tanto del contexto como de la intención del análisis.

Los outliers pueden distorsionar de manera significativa las estadísticas descriptivas: la media se desplaza hacia los valores extremos, mientras que medidas más robustas como la mediana o el rango intercuartílico resisten mejor. Por eso, el análisis exploratorio inicial es fundamental para decidir cómo tratarlos.

Las técnicas de detección son muy variadas. Existen enfoques estadísticos simples, como los z-scores o los diagramas de caja, y métodos avanzados de aprendizaje automático como Isolation Forests, One-Class SVM o autoencoders que detectan anomalías reconstruyendo solo los patrones normales.

En datos temporales, los outliers adquieren un matiz especial: un pico aislado puede ser un error de medición, pero también la huella de un evento raro y crítico (fraude, fallo técnico, crisis ambiental). Interpretar correctamente ese valor exige conocimiento experto del dominio.

Por último, los outliers plantean dilemas prácticos y éticos. Eliminar un valor atípico sin analizarlo puede ocultar un hallazgo valioso, mientras que conservar todos los registros extremos puede sesgar el entrenamiento de un modelo. El enfoque más sólido combina herramientas estadísticas y criterio contextual.

📚 Referencias: