Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Open Datasets
ImageNet
Imagen

ImageNet

ImageNet es uno de los conjuntos de datos de clasificación de imágenes más grandes e influyentes. Contiene millones de imágenes cuidadosamente clasificadas basadas en un blog inspirado en WordNet. Este conjunto de datos identificó un importante factor en el desarrollo de las redes neuronales convolucionales (CNN) y fue el origen del concurso ImageNet Large Scale Visual Recognition Challenge (ILSVRC), que supuso un avance significativo en el campo de la visión artificial.

Obtén el dataset
Tamaño

1.281.167 imágenes (formación), 50.000 imágenes (validación) y 100.000 imágenes (prueba), 1000 clases de objetos

Licencia

Se puede utilizar para fines de investigación no comerciales

Description



ImageNet es uno de los conjuntos de datos de imágenes anotadas más grandes del mundo, diseñado para la clasificación de imágenes a gran escala. Contiene más de 14 millones de imágenes agrupadas en más de 20 000 categorías (o «conjuntos de sintetizadores») derivadas de la base de datos Lexica de WordNet.


Para más de un millón de estas imágenes, las anotaciones se validarán manualmente, lo que permitirá entrenar los modelos de visión artificial con gran precisión.

El conjunto de datos es mejor conocido como la base del concurso ImageNet Large Scale Visual Recognition Challenge (ILSVRC), que aceleró los avances en la visión artificial, especialmente con la aparición de redes neuronales convolucionales (CNN) profundas, como AlexNet en 2012.

El subconjunto más utilizado (ILSVRC) contiene aproximadamente:

  • 1,2 millones de imágenes para formación
  • 50 000 para la validación
  • 100.000 para las pruebas

Clasificado en 1000 categorías de objetos.

¿Para qué sirve este conjunto de datos?



ImageNet es una referencia en el campo de la visión artificial y se utiliza para:

  • Entrenamiento de modelos de clasificación de imágenes a gran escala
  • Evaluación comparativa de la nueva arquitectura de CNN o Transformers
  • Transferencia del aprendizaje, por lo que los modelos previamente introducidos en ImageNet se pueden utilizar como base para otras tareas (detección, segmentación, etc.)
  • Puntos de referencia académicos: se trata de un estándar para probar el rendimiento de los modelos de IA en áreas de reconocimiento visual.

¿Puedes enriquecer o mejorar?

Sí, aunque es muy completo, ImageNet tiene algunas limitaciones y es mejorable:

  • Añade anotaciones contextuales: algunas imágenes carecen de metadatos o detalles de la escena.
  • Para mejorar la diversidad geográfica y cultural: ImageNet ha sido criticada por una comunidad sesgada occidental.
  • Refinamiento de clases: algunas categorías son redundantes o ambiguas y se pueden reestructurar para usos más especializados.
  • Aplicación a campos específicos: al combinar ImageNet con imágenes médicas, industriales o ambientales, podemos crear modelos que se adapten mejor a los contextos profesionales.

🔎 En resumen

Criterio Evaluación
🧩 Facilidad de uso ⭐⭐⭐⭐☆ (estándar, muy documentado)
🧼 Necesidad de limpieza ⭐⭐☆☆☆ (algunas clases con ruido)
🏷️ Riqueza de anotaciones ⭐⭐⭐⭐☆ (synsets + validación humana)
📜 Licencia comercial 🚫 No – solo uso no comercial
👨‍💻 Ideal para principiantes ✅ Sí – muy utilizado en tutoriales
🔁 Reutilizable para fine-tuning ✅ Excelente base para transferencia
🌍 Diversidad cultural ⚠️ Sesgo occidental identificado

🧠 Recomendado para

  • Estudiantes o investigadores que deseen obtener información sobre Aprendizaje profundo en visión por computador
  • Ingenieros de IA que buscan un base de transferencia robusto para nuevos conjuntos de datos
  • Empresas en desarrollo modelos de objetos genéricos o industriales, en combinación con otros conjuntos de datos especializados

🔧 Herramientas compatibles

  • Label Studio (enriquecimiento o corrección de anotaciones)
  • TensorFlow/PyTorch (tutoriales y cargadores disponibles)
  • CVAT, VGG Image Annotator (exportación/etiquetado adicionales)

💡 Consejo

Muchos modelos de código abierto (ResNet, EfficientNet, ViT...) se entrenan previamente en ImageNet. Utilícelos para ahorrar tiempo y mejorar su rendimiento desde el principio.

Preguntas frecuentes

¿Se puede usar ImageNet para proyectos profesionales o comerciales?

Sí, váyase. Algunas partes de ImageNet están disponibles bajo licencias restringidas a usos no comerciales. Por lo tanto, es esencial comparar la licencia de uso específica para cada subconjunto del conjunto de datos. Para los proyectos comerciales, se recomienda utilizar únicamente imágenes que se muestren explícitamente como gratuitas u optar por alternativas de código abierto con derechos de usuario claros.

¿Por qué ImageNet sigue teniendo una referencia cuando existen otros conjuntos de datos más recientes?

ImageNet sigue siendo esencial porque permitió la aparición de los primeros modelos importantes de visión artificial estandarizada y de alto rendimiento. La estructura jerárquica de sus categorías, su tamaño y la competencia del ILSVRC lo han convertido en una base de formación universal. Muchos modelos previamente entrenados se basan en ImageNet, lo que facilita la transferencia del aprendizaje. Sin embargo, el menú se combina con otros conjuntos de datos especializados para tareas más recientes (segmentación, multimodalidad, etc.).

¿Contiene ImageNet sus logotipos? ¿Puede corregirlo?

Sí, ImageNet contiene sus logotipos, en particular culturales, geográficos o relacionados con la representación de ciertas categorías humanas o sociales. Estos taburetes pueden afectar al rendimiento y a la imparcialidad de los modelos. Se han lanzado varias iniciativas para limpiar, reorganizar o intentar etiquetar ciertas partes del conjunto de datos. Para proyectos delicados o inclusivos, se recomienda complementar ImageNet con conjuntos de datos más representativos o enriquecer las anotaciones mediante herramientas colaborativas.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.