Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Glosario
Clustering
Definición de IA

Clustering

El clustering es una técnica de aprendizaje no supervisado que agrupa datos similares en conjuntos llamados clusters. A diferencia de la clasificación, no se proporcionan etiquetas previas; el algoritmo descubre por sí mismo los patrones y agrupamientos naturales en los datos.

Métodos comunes

  • K-Means: divide los datos en k grupos según la distancia a los centroides.
  • Clustering jerárquico: organiza los datos en una estructura en árbol.
  • DBSCAN: identifica regiones densas y marca los valores atípicos como ruido.
  • Modelos de mezclas gaussianas (GMM): suponen que los datos provienen de distribuciones normales.

Aplicaciones

El clustering es una de las herramientas más usadas en análisis exploratorio de datos, porque permite obtener una primera visión de cómo se distribuye la información. Muchas veces, descubrir que ciertos grupos existen en los datos ayuda a plantear hipótesis de negocio o investigación.

Un aspecto interesante es que no existe un único concepto de “mejor agrupamiento”. Dependiendo de la métrica de similitud utilizada (distancia euclidiana, coseno, correlación), el resultado puede variar notablemente. Por eso, la selección de características y la definición de la distancia son tan importantes como el algoritmo en sí.

En aplicaciones prácticas, el clustering se combina con otras técnicas: por ejemplo, usarlo como paso previo en recomendadores, en detección de anomalías, o para crear features sintéticas que mejoran modelos supervisados. El reto principal es la interpretabilidad: entender qué significa realmente cada grupo y cómo usarlo para tomar decisiones concretas.

Referencia

  • Jain, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern Recognition Letters, 31(8).