Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Glosario
Data Augmentation
Definición de IA

Data Augmentation

La aumentación de datos es una técnica que consiste en incrementar de manera artificial el tamaño y la diversidad de un conjunto de datos mediante transformaciones aplicadas a los ejemplos existentes. Su propósito es mejorar la capacidad del modelo para generalizar y evitar el sobreajuste.

Contexto
En aprendizaje profundo, la calidad y cantidad de los datos de entrenamiento son determinantes. Dado que recopilar y etiquetar datos suele ser costoso, la aumentación de datos se convierte en una herramienta esencial para mejorar el rendimiento de los modelos sin necesidad de adquirir más información real.

Ejemplos de técnicas

Aplicaciones

La data augmentation se puede entender como un ejercicio de creatividad algorítmica: a partir de los mismos datos, se generan variaciones que ayudan al modelo a no “encasillarse” en patrones demasiado rígidos. Esto resulta especialmente útil cuando los datos disponibles son escasos o costosos de conseguir.

En el ámbito del audio, por ejemplo, una grabación de voz puede transformarse modificando la velocidad, agregando ruido de fondo o alterando la entonación. Así, un sistema de reconocimiento de voz aprende a funcionar tanto en una oficina tranquila como en una calle llena de tráfico.

Además, la augmentación no solo mejora el rendimiento técnico, sino que también contribuye a la resiliencia ética y social de los modelos. Al diversificar las muestras, se reduce la probabilidad de que un sistema falle con usuarios que se expresan de forma diferente, lo cual es crucial en aplicaciones globales como chatbots o asistentes virtuales.

Referencias

  • Shorten, C., & Khoshgoftaar, T. M. (2019). A survey on Image Data Augmentation for Deep Learning. Journal of Big Data.