Conjunto de datos de ventas de cosméticos para minorías de Innovatiana (CRD)
Este conjunto de datos de código abierto contiene imágenes comentadas de los departamentos de cosmética de las tiendas. Fue diseñado como parte de un proyecto de prueba para minorías, con el objetivo de estructurar los datos necesarios para el desarrollo de algoritmos inteligentes para inventariar y detectar productos. Ante un contexto de colaboración difícil, Innovatiana decidió lanzar esta base para valorar el trabajo de los anotadores y apoyar los proyectos de inteligencia artificial en el sector minoritario.
4,820 imágenes anotadas, aproximadamente 245,000 etiquetas, anotaciones en formato XML (CVAT)
Úselo únicamente con fines de investigación y enseñanza. Las imágenes de los productos son propiedad de sus respectivos propietarios. El usuario debe garantizar la conformidad legal de su uso
Description
El conjunto de datos contiene:
- 4820 fotos (videoclips grabados en tiendas)
- Aproximadamente 245 000 anotaciones manuales (recuadros limitadores, polígonos)
- Hasta 500 elementos anotados por imagen
- Información sobre el diseño de la clasificación (planogramas)
- Datos estructurados en subconjuntos para facilitar la exploración
Las anotaciones se crean con CVAT, en un formato compatible con proyectos menores de visión artificial.
¿Para qué sirve este conjunto de datos?
Este conjunto de datos se puede utilizar para:
- Modelos para la detección de objetos de entrenamiento (cosméticos, equipos)
- Detección automática de productos falsos en las estanterías
- Monitorización del inventario y reconocimiento de los productos en la tienda
- Análisis de la acumulación de los planogramas
- El desarrollo de herramientas de monitoreo visual para minorías masivas
¿Puedes enriquecer o mejorar?
Si este conjunto de datos proviene de un proyecto de prueba, algunas anotaciones pueden ser parciales o inconsistentes. Recomendamos:
- Para limpiar o refinar los subjuntos anotados
- Para encontrar múltiples referencias de datos con otras fuentes (metadatos, catálogos de productos)
- Para adaptar las anotaciones a las clasificaciones internas o categorías empresariales
- Para completar la base de datos con nuevas fotos o etiquetas de trabajo
📄 Se encuentra disponible un PDF adjunto (innv-cosmetics-dataset-for-retail.pdf) para indicar los subconjuntos validados por nuestro equipo de calidad.
🔗 Fuente: Hugging Face — Conjunto de datos de Innovatiana Cosmetics
Preguntas frecuentes
¿Es la lista de conjuntos de datos para usar en el entrenamiento?
Parcialmente. Algunos subconjuntos son claros y se pueden usar, pero otros deben revisarse. El archivo PDF proporcionado le permite identificar las secciones recomendadas para la formación inicial.
¿Por qué la historia pública es este conjunto de datos?
Es un engaño de transparencia y valoración del trabajo realizado por nuestros equipos, en un contexto de disputas con los clientes. Al Publicarlo, contribuyamos a la ciencia abierta e identifiquemos las realidades de la cadena de producción de datos de la IA.
¿Las marcas presentes validaron este conjunto de datos?
No El cliente original no está afiliado a ninguna de las marcas representadas. Innovatiana no reclama ningún derecho sobre el contenido visual y actúa únicamente como anotador técnico.