Aesthetic 4K
Le dataset Aesthetic-4K est dédié à la génération d’images ultra haute résolution. Il contient des images sélectionnées avec soin et des légendes générées automatiquement par GPT-4o. Un filtrage manuel a permis d’éliminer les images floues ou de mauvaise qualité, garantissant un corpus d’excellente qualité pour l’entraînement de modèles avancés.
Description
Aesthetic-4K est un dataset d’images ultra haute résolution soigneusement sélectionnées, avec des légendes générées par GPT-4o. Le dataset a été nettoyé manuellement pour garantir la qualité des images en éliminant les flous, problèmes de mise au point et incohérences textuelles.
À quoi sert ce dataset ?
- Entraîner des modèles de génération d’images ultra haute résolution
- Tester et évaluer la synthèse d’images détaillées et esthétiques
- Améliorer la qualité et la cohérence des légendes automatiques associées aux images
Peut-on l’enrichir ou l’améliorer ?
Le dataset peut être enrichi par l’ajout de nouvelles images ultra haute résolution ou par une amélioration des annotations automatiques via d’autres modèles de langage ou annotations humaines.
🔎 En résumé
🧠 Recommandé pour
- Chercheurs en vision par ordinateur
- Développeurs de modèles diffusion
- Projets d’IA artistique
🔧 Outils compatibles
- Diffusers
- PyTorch
- TensorFlow
- Outils de traitement d’images haute résolution
💡 Astuce
Profitez des légendes GPT-4o pour guider le fine-tuning sur des tâches de génération d’images contrôlée.
Questions fréquemment posées
Quelle est la taille du dataset Aesthetic-4K ?
Environ 2 700 images ultra haute résolution, totalisant 10 Go en format parquet.
Quelles sont les caractéristiques des annotations ?
Les images sont accompagnées de légendes générées automatiquement par GPT-4o, filtrées pour la qualité.
Quelle licence couvre ce dataset ?
Le dataset est sous licence MIT, libre d’usage y compris commercial.




