Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Imagen

MNIST

El MNIST (Instituto Nacional Modificado de Estándares y Tecnología) es uno de los conjuntos de datos de aprendizaje automático más emblemáticos. Agrupa imágenes centradas y estandarizadas de números escritos a mano (del 0 al 9) que se utilizan para entrenar y evaluar modelos de clasificación de imágenes.

Obtén el dataset
Tamaño

70.000 imágenes (60.000 para la formación, 10.000 para la prueba), formato PNG o IDX

Licencia

Acceso gratuito bajo una licencia de atribución Creative Commons

Descripción


Cada imagen del conjunto de datos del MNIST es:

  • En niveles de gris
  • 28x28 píxeles de tamaño
  • Centrado y preprocesado para un aprendizaje óptimo
  • Anotado con la clase correspondiente (número entre 0 y 9)

El conjunto de datos se divide en dos conjuntos:

  • 60 000 imágenes para formación
  • 10 000 imágenes para probar

A menudo se usa como punto de partida para probar nuevos algoritmos en visión computadora/aprendizaje profundo.

¿Para qué sirve este conjunto de datos?


El MNIST se utiliza para:

  • Modelos de clasificación de imágenes de entrenamiento
  • El punto de referencia de las redes neuronales (CNN, MLP, codificadores automáticos,...)
  • La demostración educativa de los canales de aprendizaje supervisado
  • Experimentar con técnicas de agrupamiento o reducción de dimensionalidad
  • Validación de técnicas de transferencia de aprendizaje o generación de imágenes (GAN)

¿Se puede enriquecer o mejorar?


Sí, existen varios enfoques:

  • Aplica distorsiones (rotación, ruido, escala) para probar la robustez
  • Amplíe el conjunto de datos con números manuscritos multilingües
  • Utilice el MNIST como base para generar nuevos conjuntos de datos sintéticos
  • Integre datos en arquitecturas híbridas (multimodalidad, autosupervisión,...)

🔗 Fuente: Conjunto de datos MNIST

Preguntas frecuentes

¿Por qué se sigue utilizando el MNIST en la actualidad?

Porque es un estándar simple, rápido de manejar e ideal para probar o comparar nuevos algoritmos. Es un excelente punto de partida para aprender técnicas de visión artificial.

¿Hay alternativas más complejas al MNIST?

Sí: Fashion-MNIST (ropa), EMNIST (letras y números) o QuickDraw (diseños gratuitos) ofrecen variantes con diferentes niveles de dificultad.

¿El conjunto de datos está adaptado a los modelos modernos?

Para búsquedas avanzadas, el MNIST suele ser demasiado simple. Sin embargo, sigue siendo útil para crear prototipos, aprender o demostrar conceptos rápidamente.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.