«Ruido» en la IA: cómo añadir ruido a las imágenes para optimizar el entrenamiento de modelos


Añadir ruido a las imágenes puede parecer contradictorio a primera vista; después de todo, la mayoría de nosotros preferimos píxeles perfectos e imágenes lo más nítidas y claras posible. Sin embargo, la introducción de un «ruido de imagen» controlado puede mejorar drásticamente el realismo de cada píxel de una imagen, haciéndola más animada y visualmente interesante. Esta técnica es particularmente útil en el campo del renderizado 3D, la fotografía digital, la ilustración y la edición fotográfica, donde una imagen demasiado perfecta puede parecer artificial... pero también, ¡y especialmente en el campo de la inteligencia artificial!
💡 En este artículo te explicamos qué es ruido en el aprendizaje automático ¿Y cómo? añadir ruido en el aprendizaje automático, ¡esto es para optimizar el entrenamiento de los modelos!
¿Cómo se define el ruido en el aprendizaje automático?
En el aprendizaje automático, el «ruido» se refiere a cualquier tipo de datos irrelevantes o adicionales que pueden hacer que un modelo sea menos preciso (esto parece contradictorio a primera vista... ¡pero espere al siguiente!). Es como tener una charla inútil en segundo plano cuando intentas escuchar a escondidas una conversación.
Este ruido puede provenir de errores en los datos o de variaciones aleatorias que no significan nada.
Para garantizar que nuestros modelos de aprendizaje automático funcionen lo mejor posible, es importante reducir este ruido aleatorio para que los modelos puedan «escuchar» patrones importantes en los datos con mayor claridad.
Del mismo modo que el exceso de ruido en una foto puede distraer la atención del sujeto, el exceso de ruido aleatorio en los datos puede impedir que un modelo de aprendizaje automático aprenda correctamente.
¿El ruido es importante en el aprendizaje automático?
Si bien el ruido a menudo se considera una molestia, en el contexto del aprendizaje automático, a veces puede ser importante (y necesario).
El ruido puede imitar el caos del mundo real, por lo que las fuentes de ruido pueden ayudar a que un modelo sea más sólido si la cantidad de ruido se gestiona correctamente.
Por ejemplo, al entrenar con imágenes, un poco de ruido puede ayudar mejor al modelo Artista cuando encuentra datos que no son perfectos en su uso real.
Sin embargo, añadir demasiado ruido a los datos puede provocar un sobreentrenamiento, en el que el modelo aprende el ruido en lugar de la señal, ¡lo que hace que funcione mal con los datos nuevos!
💡 Por lo tanto, aunque una cantidad y un nivel de exposición controlados de las fuentes de ruido pueden mejorar la generalización de un modelo, se trata de un equilibrio delicado que debe gestionarse con cuidado.
Diferentes tipos de ruido en el aprendizaje automático
Para agregar más ruido y hacerlo bien para un mejor aprendizaje automático, necesitamos entender los diferentes tipos de ruido. Estos tipos nos ayudan a entender cómo podemos mejorar nuestra IA o el modelo utilizado y corregir los errores. ¡Estos son algunos tipos de ruidos que puedes encontrar al experimentar con inteligencia artificial!
Ruido gaussiano
El ruido gaussiano, o ruido normal, es un ruido estadístico que tiene una función de densidad de probabilidad igual a la de la distribución normal.
En el contexto del aprendizaje automático, la distribución gaussiana del ruido de lectura a menudo se agrega a los conjuntos de datos para probar la solidez de los modelos. Ayuda a simular la imprevisibilidad del mundo real y el ruido inherente de los datos.
Si bien una cantidad de ruido de lectura puede reducir ligeramente la precisión del modelo, generalmente resulta en un modelo que es más probable que se generalice.
Ruido de patrón fijo
Ruido térmico con un patrón fijo (o FPN) es otra forma de interferencia que puede afectar a las imágenes digitales, en contraste con la aleatoriedad de ruido fotónico.
Es como tener un conjunto específico de puntos en una ventana que no cambia sin importar la cantidad de luz que entre. Este tipo de ruido se produce como una mancha o un patrón constante en el sensor y permanece igual en varias fotografías tomadas en las mismas condiciones.
A diferencia del ruido fotónico, que es más frecuente en condiciones de poca luz, el ruido de patrón fijo es inherente al sensor de la cámara y, a menudo, se nota cuando se utilizan tiempos de exposición más prolongados.
Comprender y corregir la FPN es fundamental para los sistemas de visión artificial, ya que ayuda a mantener la precisión al procesar e interpretar los datos visuales.
Ruido de sal y pimienta
El ruido de sal y pimienta es una forma de ruido que aparece como píxeles blancos y negros esporádicos en un rango de una imagen.
Esto puede ocurrir debido a la exposición a transitorios rápidos en la señal o a errores de transmisión de datos.
Para los modelos de aprendizaje automático, especialmente en el procesamiento de imágenes, esto desafía al modelo a mantener la precisión sin centrarse en estos valores atípicos marcados.
Ruido de pescado
El»Ruido de disparo«, también llamado ruido de Poisson, es un tipo de ruido que puede modelarse mediante un proceso de Poisson.
Este es el componente aleatorio de la señal que normalmente se produce debido a la naturaleza discreta de la carga eléctrica o el recuento de fotones en los dispositivos ópticos.
En el aprendizaje automático, el ruido fotónico se puede introducir en las señales para evaluar la capacidad de un modelo para comprender y procesar datos con una variación aleatoria significativa.
Ruido de cuantificación
El ruido de cuantificación se introduce mediante el proceso de cuantificación en las señales digitales.
Al convertir señales de sensores analógicos en digitales, especialmente con imágenes de muestra de baja resolución, esto puede provocar una reducción de la calidad de la señal.
Los sistemas y algoritmos de aprendizaje automático que se basan en mediciones precisas para el procesamiento de señales se pueden probar contra este ruido para mejorar su rendimiento en situaciones de entrada menos que ideales.
Ruido fotónico
El ruido fotónico es un tipo de patrón de ruido repetitivo que es importante en las imágenes digitales, especialmente cuando está oscuro y los fotones de la cámara tienen problemas para ver. Imagina cada partícula pequeña de luz, o fotón, como una gota de lluvia en una tormenta.
Del mismo modo que no se puede predecir exactamente dónde caerá cada gota, las cámaras no pueden predecir qué fotón impactará en el sensor.
Esta aleatoriedad provoca puntos de zonas claras y oscuras que vemos como ruido en la foto. No es porque la cámara sea mala, es solo una parte de la forma en que funciona la luz.
Cuando enseñamos a las computadoras a reconocer imágenes, comprender el ruido de los fotones les ayuda a no confundirse con estos patrones que ocurren naturalmente en situaciones de poca luz.
¿Qué es el ruido de imagen?
El ruido de la imagen es como la granulosidad o las manchas que se ven a veces en las fotografías, especialmente cuando se toman con poca luz.
Está compuesto por píxeles oscuros formados por pequeños puntos de color o brillo que no se corresponden con la imagen real. Piense en el grano de la película como el ruido estático en la pantalla de un televisor, pero en sus fotos.
Al igual que el ruido estático, estos puntos parecen aleatorios y no deberían estar ahí.
Este ruido puede producirse por muchas razones, por ejemplo, cuando la cámara está intentando captar luz pero, en cambio, detecta pequeños errores.
También puede deberse a que el sensor de la cámara se caliente demasiado durante el uso. Estos puntos indeseados de ruido al leer pueden resultar molestos, pero a veces ayudan a que una foto tenga un aspecto más natural o ayudan a los ordenadores a aprender a reconocer imágenes que no son perfectas.
En el contexto de la detección de números con IA (por ejemplo), la adición de ruido a las imágenes a veces se usa intencionalmente cuando enseñamos a las computadoras a ver. Es como mostrarles imágenes imperfectas para que, cuando vean algo similar en el mundo real, siempre sepan de qué se trata.
Esto es importante en el aprendizaje automático, cuando las computadoras están capacitadas para aprender y comprender por sí mismas, para que puedan determinar lo que están viendo, incluso cuando la imagen original en sí misma no es clara.
Sin embargo, el exceso de ruido dificulta mucho las cosas para los modelos, del mismo modo que es difícil ver una imagen cuando hay mucho ruido estático.
¿Por qué añadimos ruido a las imágenes para el aprendizaje automático?
Ya sea que necesite medir el ruido o añadirlo, existen diversas razones por las que identificamos filtros de ruido para las imágenes de aprendizaje automático.
Desde imágenes de un solo píxel hasta imágenes detalladas de alta resolución, leemos el ruido para tener mejores modelos de aprendizaje automático.
¡Aquí hay algunas razones para agregar ruido a las imágenes para el aprendizaje automático! Te lo contaremos todo a continuación.
Simplificación de la imagen
A veces, cuando entrenamos a las computadoras para que reconozcan cosas en imágenes, agregamos pequeños errores intencionalmente. Es un poco como armar un rompecabezas con algunas piezas de otro conjunto.
Esto ayuda a la computadora a descubrir mejor lo que está viendo, incluso cuando la imagen no es perfecta. Tiene que hacer frente a pequeños cambios o cuando surge algo inesperado.
Preparándose para el mundo real
El mundo real es desordenado y no siempre perfecto.
Al añadir ruido, entrenamos a la cámara y al ordenador para que reconozcan patrones de ruido y objetos periódicos no solo en un entorno limpio e ideal, sino también en el mundo real e imperfecto. Es como aprender a jugar al baloncesto con el viento: afrontas mejor situaciones difíciles.
Evite el sobreaprendizaje
Imagina aprender a tocar una canción en el piano en una habitación y no poder tocarla en ningún otro lugar. Es sobreaprender.
Es cuando una computadora aprende algo con demasiada precisión y cuando algo cambia ligeramente, no sabe qué hacer.
Agregar más ruido a los filtros de ruido de la imagen evita que la computadora los aprenda con demasiada precisión, por lo que siempre puede entenderlos si algo cambia un poco.
Un «cerebro» informático más fuerte
Agregar ruido a las imágenes fortalece el «cerebro» de la computadora. Es como una vacuna para una computadora.
Expóngalo a un poco del problema de manera controlada y aprenderá a ignorarlo o a afrontarlo mejor en el futuro.
Este proceso ayuda al cerebro de la computadora a ignorar cosas sin importancia y a centrarse en lo que realmente importa en una imagen.
Mantener el equilibrio
Al igual que las especias en los alimentos, la cantidad adecuada de ruido puede ser buena, pero demasiado ruido puede arruinar las cosas.
Necesitamos encontrar la mejor cantidad de ruido para agregar a las imágenes para que la computadora pueda aprender sin confundirse.
Es un equilibrio delicado que los científicos informáticos están trabajando arduamente para lograr.
Los casos de uso del «ruido» en la inteligencia artificial
En el aprendizaje automático, el ruido no es solo un error; de hecho, es una herramienta útil. Piense en el ruido como esos pequeños desafíos que ayudan a las computadoras a ser más inteligentes. Así es como funciona:
Hacer que los modelos sean más robustos
Del mismo modo que los músculos se fortalecen con el ejercicio, los modelos y algoritmos informáticos mejoran cuando trabajan con datos ruidosos. Esta práctica los hace lo suficientemente robustos como para manejar información real y confusa.
Prueba y mejora
El ruido es como una prueba para los programas de ordenador. Al proporcionarles datos fidedignos, podemos ver lo buenos que son. Ayuda a las personas a mejorar aún más los programas.
Evita errores
Cuando una computadora solo tiene la información que quiere y ve ejemplos perfectos, puede confundirse con el más mínimo error. Al mostrar datos en gran cantidad, por ejemplo, el ordenador aprende a ignorar los pequeños errores y a centrarse en los pequeños detalles de lo que es importante.
Cree modelos que sean resilientes y estén preparados para cualquier eventualidad
En la vida real, las cosas no son perfectas. El ruido enseña a las computadoras a esperar lo inesperado, de modo que cuando están en el mundo real, están preparadas para todo el desorden.
Hacer que el aprendizaje sea «profundo»
El ruido ayuda al aprendizaje profundo, que es una forma en que las computadoras aprenden a tomar decisiones. Es como enseñarle a alguien a cocinar probando diferentes recetas. Con el ruido, las computadoras aprenden no solo las cosas fáciles, sino también las difíciles.
Añadir ruido es muy importante, pero demasiado ruido constante puede ser un problema. Es como si una imagen fuera demasiado borrosa, es difícil saber qué es.
Por eso, los científicos y los especialistas en inteligencia artificial están trabajando arduamente para encontrar la cantidad justa de ruido que se debe utilizar. Se trata de encontrar el punto perfecto en el que la computadora pueda aprender mucho sin perderse.
Conclusión
En conclusión, agregar la cantidad correcta de ruido a los datos es fundamental en el aprendizaje automático. Esto ayuda a los ordenadores a hacer frente a las imperfecciones y a adaptarse al mundo real, al igual que cuando aprenden a practicar un deporte en condiciones que no son las ideales. Esto podría compararse con «ejercitar» un ordenador para que funcione mejor. Sin embargo, al igual que en la cocina, abusar de lo bueno puede ser perjudicial: el equilibrio es clave.
¡Te lo hemos contado todo! Si esto te pareció interesante, no dudes en explorar otros aspectos del aprendizaje automático para ver cómo se aplican estos conceptos en una variedad de áreas, mejorando la capacidad de los sistemas de inteligencia artificial para aprender y evolucionar.