Open Images Dataset
Conjunto de datos de imágenes abierto El conjunto de datos de imágenes abierto es un recurso clave de visión artificial, que ofrece millones de imágenes anotadas con precisión para una variedad de tareas, como la detección, la segmentación y el análisis de contexto. Su gran cantidad de anotaciones y categorías lo convierte en una herramienta esencial para el entrenamiento de modelos visuales potentes.
Más de 9 millones de imágenes en formato JPEG, anotaciones detalladas en CSV
Gratis para uso académico y comercial bajo una licencia específica (ver condiciones)
Descripción
Open Images Dataset reúne más de 9 millones de imágenes con anotaciones precisas que incluyen cuadros delimitadores, segmentos de imágenes, relaciones entre objetos y descripciones contextuales detalladas. Estas detalladas anotaciones facilitan el entrenamiento de modelos complejos que pueden comprender no solo los objetos individuales, sino también las interacciones y el contexto general de las escenas visuales.
El formato de anotación CSV facilita su integración con las herramientas estándar de visión artificial y permite un uso flexible y eficiente al entrenar modelos.
El conjunto de datos incluye:
- Más de 9 millones de imágenes en formato JPEG
- Anotaciones detalladas en formato CSV
- Más de 16 millones de etiquetas en miles de clases de objetos
- Anotaciones complejas que incluyen relaciones entre objetos y descripciones contextuales
¿Para qué sirve este conjunto de datos?
El conjunto de datos de imágenes abiertas se usa ampliamente para:
- Entrenamiento de modelos avanzados de detección y segmentación de objetos
- Análisis y comprensión profunda de las relaciones entre los objetos presentes en las imágenes
- La mejora de los sistemas avanzados de búsqueda visual y reconocimiento de imágenes
- La construcción de modelos robustos y versátiles gracias a su diversidad y riqueza de datos
¿Se puede enriquecer o mejorar?
Sí, a pesar de su gran riqueza, Open Images Dataset se puede enriquecer aún más:
- Aumentar la cobertura geográfica y cultural para reducir los sesgos
- Ampliar las anotaciones contextuales para mejorar la comprensión del contexto general de las escenas
- Introducción de nuevas categorías o subcategorías específicas para aplicaciones industriales o profesionales
- Combinación con conjuntos de datos especializados para mejorar el rendimiento en áreas específicas como la medicina, la industria o el medio ambiente
🔗 Fuente: Abrir conjunto de datos de imágenes
Preguntas frecuentes
¿En qué se diferencia Open Images de un conjunto de datos como COCO o ImageNet?
Open Images destaca por la diversidad de sus anotaciones: no solo ofrece cuadros abarcadores, sino también relaciones entre objetos, anotaciones jerárquicas y segmentos de imágenes. Abarca más clases que ImageNet y COCO juntas, lo que lo convierte en un recurso versátil para una variedad de tareas de visión.
¿Solo puedo extraer imágenes con anotaciones de segmentación o relación entre objetos?
Sí, el sitio oficial del conjunto de datos le permite filtrar los subconjuntos por tipo de anotación. Por lo tanto, solo puede descargar imágenes que contengan segmentos (máscaras de segmentación), anotaciones de «relaciones visuales» o ambas.
¿Cuáles son las limitaciones a tener en cuenta al usar Open Images?
La complejidad y la cantidad de anotaciones pueden requerir un procesamiento previo significativo. Además, la granularidad de las etiquetas puede variar de una clase a otra, por lo que es necesario comprobar la coherencia en el caso de proyectos delicados o muy específicos.