Urban Sound 8K
El conjunto de datos UrbanSound8K es una colección de grabaciones de sonido capturadas en varios entornos urbanos. Este corpus es particularmente útil para la formación de modelos capaces de identificar y clasificar los sonidos típicos de las ciudades, como las sirenas, las bocinas, los ruidos de las construcciones o las voces humanas.
8732 clips de audio, formato WAV
Gratis bajo una licencia Creative Commons Attribution 4.0 International (CC BY 4.0)
Descripción
El conjunto de datos ofrece una variedad completa de sonidos urbanos:
- 8732 clips de audio con anotaciones individuales
- Duración estandarizada de 4 segundos por extracto
- 10 categorías distintas: bocinas, sirenas, trabajos, niños jugando, ladrando, motores, etc.
- Grabaciones capturadas en contextos reales y variados, con niveles de sonido realistas
Se utiliza con frecuencia en la investigación de paisajes sonoros y sistemas de identificación acústica en entornos urbanos.
¿Para qué sirve este conjunto de datos?
UrbanSound8K se utiliza principalmente para:
- Formación de modelos de reconocimiento y clasificación de audio en entornos urbanos
- El desarrollo de soluciones para la monitorización de la contaminación acústica
- La mejora de los sistemas integrados capaces de identificar los sonidos ambientales (ciudades inteligentes, seguridad pública)
- Investigación en acústica ambiental y ecología del sonido urbano
¿Se puede enriquecer o mejorar?
Sí, existen varias posibilidades:
- Añade sonidos urbanos de otras regiones geográficas o climáticas
- Enriquece las anotaciones con metadatos contextuales adicionales (hora, clima, tráfico)
- Mezcle o superponga sonidos para simular entornos acústicos complejos
- Pruebe la solidez de los modelos con sonidos degradados (ruido, distorsiones, etc.)
🔗 Fuente: Conjunto de datos UrbanSound8k
Preguntas frecuentes
¿Se puede usar UrbanSound8K para aplicaciones comerciales?
Sí, sujeto al cumplimiento de los términos de la licencia CC BY 4.0, incluida la atribución adecuada a los autores.
¿Existe una versión más grande del conjunto de datos?
Sí, UrbanSound también ofrece UrbanSound8k y UrbanSoundClassification (una versión ampliada con otros extractos y anotaciones).
¿Las grabaciones son representativas de las principales ciudades?
Los sonidos provienen en su mayoría de Nueva York, pero son bastante típicos de los entornos urbanos globales. Para aumentar la diversidad geográfica, se recomienda combinarlos con otros corpus.