Conjunto de datos para la detección de peatones: los mejores recursos para entrenar su IA


La detección de peatones es un desafío importante en la inteligencia artificial, especialmente en los campos de la vigilancia urbana, los vehículos autónomos y la prevención de accidentes. Los modelos de visión artificial capaces de identificar con precisión la presencia de peatones se basan en bases de datos específicas: conjuntos de datos o datasets.
Un conjunto de datos para la detección de peatones es una colección de fotos anotado que permite entrenar y evaluar los algoritmos de aprendizaje automático. Estos dato son esenciales para enseñar a los modelos a reconocer figuras humanas en diferentes entornos y bajo diversas condiciones (iluminación, clima, densidad de peatones)... para casos de uso de «seguridad», ¡por supuesto respetuosos con los datos personales!
En este artículo, vamos a prestar atención a los mejores Conjuntos de datos disponible para entrenar a una IA para que detecte a los peatones con precisión. También veremos cómo estas bases de dato están estructurados y cómo usarlos para mejorar el rendimiento de sus modelos de reconocimiento defotos.
Datos y anotaciones: la clave para un conjunto de datos potente
La eficacia de un modelo de detección de peatones depende directamente de la calidad de dato utilizado para su entrenamiento. Un conjunto de datos bien estructurado, anotado con precisión y que cubre una amplia gama de situaciones permite mejorar la confiabilidad del algoritmo. Por otro lado, dato incompleto o anotado incorrectamente puede provocar errores de detección y comprometer el rendimiento del modelo.
¿Por qué es fundamental la calidad de los datos en la IA?
Un modelo de detección de peatones se basa en dato anotado con precisión. Una anotación deficiente o un conjunto de datos desequilibrado pueden provocar errores en el reconocimiento de los peatones y aumentar los falsos positivos o los descuidos. Un conjunto de datos eficaz debe incluir dato variado, cubriendo diferentes posiciones de los peatones, condiciones climáticas y entornos (áreas urbanas, carreteras, aceras, pasos de peatones).

Tipos de anotaciones utilizadas en los conjuntos de datos para la detección de peatones
- Cajas delimitadoras : Delineación de los peatones con rectángulos para ubicarlos en la imagen.
- Segmentación semántica : Identificación más precisa de los contornos de los peatones.
- Puntos clave : Detección de articulaciones para analizar posturas y movimientos.
La rigurosa anotación de dato es esencial para mejorar la solidez de los modelos y reducir los sesgos asociados con un muestreo insuficiente.
Los criterios para elegir un conjunto de datos adecuado
La formación de un modelo de alto rendimiento se basa en el uso de un Conjunto de datos adaptado. Un buen Conjunto de datos de detección de peatones debe contener fotos variada, dato bien anotado y una amplia cobertura de posibles escenarios. Algunos conjuntos de datos se especializan en entornos urbanos, mientras que otros incluyen tomas nocturnas o térmicas.

La elección de un Conjunto de datos depende de varios factores:
Tamaño y diversidad (imagen)
Además, un conjunto de datos contienefotos, en diferentes formatos, cuanto más pueda generalizar el modelo sus predicciones. Un conjunto de datos equilibrado debe incluir escenas variadas (carreteras, aceras, aparcamientos, pasos de peatones).
Precisión de las anotaciones
Las anotaciones deben ser detalladas y coherentes, con diferentes tipos de marcas (casillas delimitadoras, segmentación).
Accesibilidad
Algunos conjuntos de datos son de acceso abierto, mientras que otros requieren autorización o suscripción.
Especificidad del contexto
Un conjunto de datos se puede optimizar para un tipo de detección en particular (peatones en un entorno urbano, peatones vistos desde un dron, detección térmica, etc.).
Los mejores conjuntos de datos para la detección de peatones
Aquí está 10 de los mejores conjuntos de datos disponibles para la detección de peatones, clasificados según su contenido, sus anotaciones y sus aplicaciones específicas.
1. Conjunto de datos de peatones de Caltech
Descripción : Este conjunto de datos es uno de los más populares para entrenar y evaluar modelos de detección de peatones. Se capturó con un sensor integrado en un vehículo que circulaba por las calles de Los Ángeles.
Contenidos :
- Entorno 250.000 imágenes extraído de vídeos, con 350.000 instancias de peatones.
- Anotaciones en Cajas delimitadoras, con clases según el nivel de ocultación de los peatones (enteros, parcialmente ocultos, altamente ocultos).
Apps : Se utiliza principalmente para el entrenamiento de modelos de visión de vehículos autónomos y sistemas de vigilancia urbana.
2. Conjunto de datos de City Persons
Descripción : Una extensión del conjunto de datos Cityscapes, se centra específicamente en la detección de peatones en áreas urbanas.
Contenidos :
- Más de 5.000 imágenes alta resolución tomada en varias ciudades europeas.
- 35 000 anotaciones Precisión para peatones con casillas delimitadoras y etiquetas detalladas (adulto, niño, ciclista, parcialmente ocultas).
Apps : Ideal para reconocer a los peatones en entornos densos con una amplia variedad de situaciones urbanas.
3. Conjunto de datos de personas de EuroCity
Descripción : Este conjunto de datos europeo ofrece una amplia variedad de condiciones climáticas y ambientales, lo que permite un entrenamiento sólido de los modelos.
Contenidos :
- Más de 47.000 imágenes capturados en varias ciudades europeas.
- Diversidad de escenas: lluvia, niebla, nieve, sol, noche.
- Anotaciones detalladas que incluyen la posición, el tamaño y la visibilidad de los peatones.
Apps : Adaptado a modelos que requieren una mayor robustez frente a las variaciones climáticas y los cambios de iluminación.
4. Conjunto de datos multiespectrales de peatones KAIST
Descripción : Diseñado para la detección de peatones en condiciones de poca luz, este conjunto de datos integra imágenes térmicas y visibles.
Contenidos :
- 95.000 imágenes con doble captura en el espectro visible e infrarrojo.
- Anotaciones detalladas con cuadros delimitadores alineados con ambos espectros.
Apps : Esencial para los vehículos autónomos y la videovigilancia nocturna o en entornos de baja visibilidad.
5. Conjunto de datos de detección de ciclistas y peatones de Tsinghua-Daimler (TDC-PED)
Descripción : Capturado en China y Alemania, este conjunto de datos se centra en la detección de peatones y ciclistas en un contexto de conducción autónoma.
Contenidos :
- 100 000 imágenes capturados de vehículos en el tráfico.
- Anotación precisa de peatones y ciclistas desde varias posiciones y ángulos.
Apps : Diseñado para el reconocimiento de peatones y ciclistas en condiciones reales de tráfico.
6. Conjunto de datos de personas del INRIA
Descripción : Uno de los primeros conjuntos de datos dedicados a la detección de peatones, que se utiliza a menudo para probar algoritmos de visión artificial.
Contenidos :
- 1.800 imágenes alta resolución con anotaciones detalladas.
- Escenas urbanas y de ocio, con diferentes posturas de los peatones.
Apps : Se utiliza para el desarrollo inicial de modelos de reconocimiento de peatones.
7. Conjunto de datos de peatones de Penn-Fudan
Descripción : conjunto de datos más pequeño pero bien anotado, útil para experimentos rápidos y segmentación avanzada.
Contenidos :
- 170 imágenes alta resolución con anotaciones precisas en cuadros delimitadores y segmentación semántica.
Apps : Ideal para pruebas rápidas o modelos que requieren una segmentación detallada de los peatones.
8. Conjunto de datos MOT17 (seguimiento de múltiples objetos)
Descripción : conjunto de datos orientado a la monitorización de los peatones a través de varias imágenes sucesivas.
Contenidos :
- Imágenes de vídeo capturadas en un entorno urbano.
- Anotaciones detalladas para el seguimiento de peatones cuadro por cuadro.
Apps : Adaptado a modelos que requieren capacidad de monitoreo en tiempo real, como el monitoreo automatizado.
9. Conjunto de datos CUHK Square
Descripción : Este conjunto de datos se diseñó para analizar el comportamiento de los peatones en los espacios públicos.
Contenidos :
- 10 000 imágenes capturados en plazas públicas con una alta densidad de peatones.
- Anotaciones que permiten la detección y el reconocimiento de personas entre multitudes.
Apps : Se utiliza para el análisis de movimientos y la detección de comportamientos anormales en áreas urbanas.
10. Conjunto de datos LIP (Look Into Person)
Descripción : Este conjunto de datos contiene anotaciones detalladas para detectar a los peatones en términos de ropa y posturas.
Contenidos :
- 50 000 imágenes con anotaciones de partes del cuerpo y ropa.
- Detección precisa de siluetas y segmentación de las distintas partes de los peatones.
Apps : Se usa para modelos que requieren una comprensión detallada de los peatones, especialmente para aplicaciones de moda o reconocimiento facial.
Conclusión
La detección de peatones en inteligencia artificial se basa en el uso de conjuntos de datos variado y bien anotado. La elección del conjunto de datos es esencial para garantizar los resultados, en particular la precisión y la solidez de los modelos frente a diversas condiciones reales: entorno urbano, poca luz, cambios climáticos, densidad de peatones. Los conjuntos de datos presentados en este artículo ofrecen una variedad de escenarios adaptados a las necesidades específicas de cada proyecto, ya se trate de vigilancia, vehículos autónomos o análisis del comportamiento.
La mejora continua de los conjuntos de datos y las técnicas de anotación desempeña un papel clave en el desarrollo de modelos más eficientes y confiables. La selección cuidadosa de los datos y la formación adecuada permiten optimizar la detección y mejorar la seguridad de los sistemas basados en la inteligencia artificial.