Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Glosario
Convolution
Definición de IA

Convolution

La convolución es una operación matemática central en las redes neuronales convolucionales (CNN). Consiste en aplicar un filtro o kernel sobre los datos de entrada (como una imagen) para extraer patrones relevantes, tales como bordes, texturas o formas.

Funcionamiento

  • Los filtros se entrenan automáticamente para identificar características discriminantes.
  • Varias capas de convolución permiten pasar de representaciones locales simples a estructuras complejas.

Ejemplo
Un filtro en visión por computador puede detectar los contornos de los objetos en una imagen, mientras que capas más profundas identifican caras o señales de tráfico.

Un aspecto clave de la convolución es la compartición de parámetros. A diferencia de las capas totalmente conectadas, donde cada peso es único, las capas convolucionales reutilizan el mismo filtro en toda la entrada. Esto reduce drásticamente el número de parámetros, lo que hace que las CNN sean más eficientes y menos propensas al sobreajuste en comparación con arquitecturas densas.

Las operaciones de pooling suelen acompañar a las convoluciones para condensar aún más la información. El max pooling, por ejemplo, selecciona el valor más alto dentro de una región, creando una representación más abstracta e invariante frente a pequeñas traslaciones. Esta propiedad es fundamental en clasificación de imágenes, donde lo relevante es la presencia de un objeto más que su posición exacta.

La convolución no se limita a las imágenes. En procesamiento de lenguaje natural, las convoluciones 1-D permiten capturar patrones locales de palabras, como los n-gramas, mejorando la clasificación de textos o el análisis de sentimientos. De manera similar, en el procesamiento de audio, las capas convolucionales identifican componentes de frecuencia y estructuras temporales, facilitando tareas como el reconocimiento del habla o la clasificación de géneros musicales.

Por último, la investigación actual ha ampliado el alcance de las convoluciones. Las convoluciones dilatadas aumentan el campo receptivo sin incrementar el coste computacional, mientras que las convoluciones separables en profundidad (empleadas en MobileNet) hacen posible que las CNN funcionen de manera eficiente en dispositivos móviles. Estas innovaciones demuestran cómo el principio básico de la convolución sigue evolucionando y adaptándose a las necesidades de las aplicaciones modernas de IA.

Referencia

  • Gu, J., Wang, Z., Kuen, J., et al. (2018). Recent advances in convolutional neural networks. Pattern Recognition.