Linear Regression
La regresión lineal es un algoritmo de aprendizaje supervisado que permite modelar la relación entre una variable dependiente (resultado) y una o más variables independientes (predictores), ajustando una línea recta o un hiperplano. En inteligencia artificial, constituye uno de los métodos más básicos y utilizados para predicción y análisis de datos.
Contexto y origen
El concepto de regresión lineal tiene su origen en el siglo XIX, con los trabajos de Francis Galton y Karl Pearson. Nació como una técnica estadística para estudiar correlaciones, pero su sencillez y claridad la convirtieron en una de las primeras herramientas aplicadas en machine learning. Hoy en día, se utiliza tanto en investigación como en aplicaciones industriales, y sigue siendo un modelo de referencia frente a algoritmos más complejos.
Aplicaciones prácticas
- Economía y finanzas: predicción del precio de la vivienda, de ingresos o de rendimientos bursátiles.
- Sanidad: análisis de la relación entre factores de riesgo y enfermedades.
- Inteligencia artificial: utilizada como modelo base en proyectos de predicción y comparación con redes neuronales u otros enfoques.
- Negocios y marketing: cálculo del impacto de campañas publicitarias en las ventas.
Retos y limitaciones
La regresión lineal supone que la relación entre variables es estrictamente lineal, lo que rara vez refleja la complejidad de los datos reales. También requiere hipótesis estadísticas como homocedasticidad, independencia de errores y ausencia de multicolinealidad. Aunque estas condiciones no siempre se cumplen, la regresión lineal mantiene su relevancia por ser interpretativa, rápida y base de modelos más sofisticados como la regresión logística o los modelos lineales generalizados.
Referencias
- Wikipedia – Regresión lineal
- James, G. et al. (2013). An Introduction to Statistical Learning.
- Hastie, T., Tibshirani, R., Friedman, J. (2009). The Elements of Statistical Learning.