Conjunto de datos de Fashionpedia
Conjunto de datos de moda visual derivado de Fashionpedia, adaptado a la detección y búsqueda de objetos de ropa (blusas, zapatos, bolsos, etc.).
93.600 imágenes (JPEG) con anotaciones de objetos
Atribución 4.0 Internacional (CC BY 4.0)
Descripción
El conjunto de datos Fashionpedia es una versión modificada del conjunto de datos original, que se centra en el reconocimiento visual y la recuperación de objetos relacionados con la moda. Contiene más de 93 000 imágenes de estilo urbano de catálogos en línea, anotadas según categorías como blusas, pantalones, zapatos y accesorios (bolsos, relojes, gafas, etc.).
¿Para qué sirve este conjunto de datos?
- Modelos de detección de objetos de entrenamiento para la moda
- Creación de motores de búsqueda de imágenes basados en la similitud (por ejemplo, CLIP)
- Desarrollar sistemas visuales de recomendación de ropa
¿Se puede enriquecer o mejorar?
Sí, el conjunto de datos se puede ampliar con metadatos como la estación, el estilo o los materiales. También es posible vincular los objetos detectados con descripciones textuales para aprender el lenguaje visual. Los clústeres por color o morfología también pueden mejorar los resultados de búsqueda o recomendación.
🔎 En resumen
🧠 Recomendado para
- Startups de IA y moda
- Buscadores de moda
- Proyectos CLIP especializados
🔧 Herramientas compatibles
- Yolo V8
- CLIP
- Roboflow
- Detector 2
- OpenCV
💡 Consejo
Combine este conjunto de datos con descripciones de texto generadas automáticamente para crear un sistema de correspondencia de imagen a texto.
Preguntas frecuentes
¿Se puede usar este conjunto de datos para clasificar estilos de ropa?
Indirectamente sí, combinando los objetos detectados con reglas o un modelo supervisado para clasificar los estilos (casual, deportivo, etc.).
¿Este conjunto de datos es compatible con los modelos CLIP?
Sí, está diseñado específicamente para tareas visuales-textuales, como la búsqueda de imágenes por texto o viceversa.
¿Hay anotaciones para colores o texturas?
No, las anotaciones se centran en las categorías de objetos. Sin embargo, puede extraerlas mediante el procesamiento de imágenes.