Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Open Datasets
Aesthetic 4K
Imagen

Aesthetic 4K

El conjunto de datos Aesthetic-4K está dedicado a la generación de imágenes de resolución ultra alta. Contiene imágenes y subtítulos cuidadosamente seleccionados generados automáticamente por GPT-4o. El filtrado manual eliminó las imágenes borrosas o de mala calidad, lo que garantiza un corpus de excelente calidad para el entrenamiento de modelos avanzados.

Obtén el dataset
Tamaño

Aproximadamente 2.700 imágenes, 10 GB, formato parquet

Licencia

MIT

Descripción

Aesthetic-4K es un conjunto de datos de imágenes de ultra alta resolución cuidadosamente seleccionadas, con subtítulos generados por GPT-4o. El conjunto de datos se limpió manualmente para garantizar la calidad de la imagen al eliminar las imágenes borrosas, los problemas de enfoque y las inconsistencias textuales.

¿Para qué sirve este conjunto de datos?

  • Entrene modelos de generación de imágenes de resolución ultra alta
  • Probar y evaluar la síntesis de imágenes detalladas y estéticas
  • Mejore la calidad y la coherencia de los subtítulos automáticos asociados a las imágenes

¿Se puede enriquecer o mejorar?

El conjunto de datos se puede enriquecer añadiendo nuevas imágenes de resolución ultra alta o mejorando las anotaciones automáticas mediante otros modelos lingüísticos o anotaciones humanas.

🔎 En resumen

Criterio Evaluación
🧩 Facilidad de uso⭐⭐⭐⭐✩ (Dataset limpio, listo para usar)
🧼 Necesidad de limpieza⭐⭐⭐⭐⭐ (Muy bajo, filtrado manual realizado)
🏷️ Riqueza de anotaciones⭐⭐⭐⭐✩ (Captions generadas por GPT-4o, buenas pero automáticas)
📜 Licencia comercial✅ Sí (MIT)
👨‍💻 Ideal para principiantes✅ Sí, pequeño volumen pero alta calidad
🔁 Reutilizable para fine-tuning✅ Perfecto para generación de imágenes de alta resolución
🌍 Diversidad cultural⚠️ No especificada, imágenes variadas

🧠 Recomendado para

  • Investigadores de visión artificial
  • Desarrolladores de modelos de transmisión
  • Proyectos artísticos de IA

🔧 Herramientas compatibles

  • Diffusers
  • PyTorch
  • TensorFlow
  • Herramientas de procesamiento de imágenes de alta resolución

💡 Consejo

Aproveche las leyendas de GPT-4o para guiar el ajuste de las tareas de generación de imágenes controladas.

Preguntas frecuentes

¿Cuál es el tamaño del conjunto de datos Aesthetic-4K?

Aproximadamente 2.700 imágenes de resolución ultra alta, con un total de 10 GB en formato parquet.

¿Cuáles son las características de las anotaciones?

Las imágenes van acompañadas de subtítulos generados automáticamente por GPT-4o, filtrados para garantizar su calidad.

¿Qué licencia cubre este conjunto de datos?

El conjunto de datos está bajo la licencia MIT, es de uso gratuito, incluso comercial.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.