Data Augmentation
La aumentación de datos es una técnica que consiste en incrementar de manera artificial el tamaño y la diversidad de un conjunto de datos mediante transformaciones aplicadas a los ejemplos existentes. Su propósito es mejorar la capacidad del modelo para generalizar y evitar el sobreajuste.
Contexto
En aprendizaje profundo, la calidad y cantidad de los datos de entrenamiento son determinantes. Dado que recopilar y etiquetar datos suele ser costoso, la aumentación de datos se convierte en una herramienta esencial para mejorar el rendimiento de los modelos sin necesidad de adquirir más información real.
Ejemplos de técnicas
- Visión por computador: rotaciones, recortes, volteo, cambio de brillo, ruido aleatorio.
- Procesamiento del lenguaje natural (PLN): sustitución de palabras por sinónimos, traducción inversa, eliminación de palabras.
- Audio: cambio de velocidad, ruido de fondo, variación de tono.
Aplicaciones
- Diagnóstico médico asistido por IA.
- Reconocimiento de voz robusto a entornos ruidosos.
- Traducción automática más generalizable.
- Detección de objetos en coches autónomos.
La data augmentation se puede entender como un ejercicio de creatividad algorítmica: a partir de los mismos datos, se generan variaciones que ayudan al modelo a no “encasillarse” en patrones demasiado rígidos. Esto resulta especialmente útil cuando los datos disponibles son escasos o costosos de conseguir.
En el ámbito del audio, por ejemplo, una grabación de voz puede transformarse modificando la velocidad, agregando ruido de fondo o alterando la entonación. Así, un sistema de reconocimiento de voz aprende a funcionar tanto en una oficina tranquila como en una calle llena de tráfico.
Además, la augmentación no solo mejora el rendimiento técnico, sino que también contribuye a la resiliencia ética y social de los modelos. Al diversificar las muestras, se reduce la probabilidad de que un sistema falle con usuarios que se expresan de forma diferente, lo cual es crucial en aplicaciones globales como chatbots o asistentes virtuales.
Referencias
- Shorten, C., & Khoshgoftaar, T. M. (2019). A survey on Image Data Augmentation for Deep Learning. Journal of Big Data.