CeleBA
CelEBA (CelebFaces Attributes Dataset) es un conjunto de datos icónico de visión artificial, centrado en rostros humanos. Se usa ampliamente en los campos del reconocimiento facial, la generación de imágenes y el análisis de atributos faciales, gracias a la riqueza de sus anotaciones.
Más de 200 000 imágenes de rostros en formato JPEG, anotaciones en archivos TXT
Gratuito para uso académico bajo las condiciones específicas de la licencia CelEBA
Descripción
El conjunto de datos CelEBA incluye:
- 202.599 imágenes JPEG de rostros de famosos
- 40 atributos anotados por imagen
- 5 puntos de referencia por rostro para la alineación facial
- Máscaras de segmentación binaria en la versión CelebaMask-HQ
CelEBA es reconocido por la diversidad de rostros representados, en términos de rasgos, edades y accesorios, lo que lo convierte en un recurso de elección para entrenar modelos robustos y generalizables.
¿Para qué sirve este conjunto de datos?
CeleBA se usa comúnmente para:
- Entrenamiento de modelos de reconocimiento facial
- Análisis y clasificación de los atributos faciales
- Capacitación de GAN (redes generativas de confrontación) para la generación de imágenes faciales sintéticas
- La evaluación de modelos de detección o modificación de atributos (añadir una sonrisa, quitarse las gafas, etc.)
¿Se puede enriquecer o mejorar?
Sí, CelEBA se puede mejorar de varias maneras:
- Añadiendo nuevos atributos específicos para determinadas poblaciones o expresiones culturales
- Al combinarse con otros conjuntos de datos faciales para mejorar la diversidad demográfica
- Refinando las máscaras de segmentación para tareas de procesamiento más precisas
- Al integrar CelEBA en canalizaciones multimodales (voz + imagen, texto + imagen) para aplicaciones más amplias
🔗 Fuente: Conjunto de datos CelEBA
Preguntas frecuentes
¿Puedo usar CeleBA para probar modelos de generación facial?
Sí, CeleBA es ideal para eso. Se utiliza como referencia para entrenar o probar las GAN, debido a la calidad y variedad de rostros.
¿Cómo gestionar los sesgos presentes en este conjunto de datos?
CelEBA ha sido criticada por una representación desequilibrada de ciertos orígenes étnicos o géneros. Para limitar el sesgo, se recomienda complementarlo con otros conjuntos de datos más representativos o ajustar las ponderaciones durante el entrenamiento.
¿Existe una versión con máscaras de segmentación?
Sí, la versión CelebamaSk-HQ incluye anotaciones de segmentación de alta calidad para entrenar a los modelos en tareas de segmentación facial precisa.