UrbanSound8K
Le UrbanSound8K Dataset est une collection d’enregistrements sonores capturés dans différents environnements urbains. Ce corpus est particulièrement utile pour l'entraînement de modèles capables d'identifier et de classifier les sons typiques des villes, comme les sirènes, klaxons, bruits de travaux ou voix humaines.
8732 clips audio, format WAV
Libre sous licence Creative Commons Attribution 4.0 International (CC BY 4.0)
Description
Le dataset propose une variété complète de sons urbains :
- 8732 clips audio annotés individuellement
- Durée standardisée de 4 secondes par extrait
- 10 catégories distinctes : klaxons, sirènes, travaux, enfants jouant, aboiements, moteurs, etc.
- Enregistrements capturés dans des contextes réels et variés, avec des niveaux sonores réalistes
Il est fréquemment utilisé dans la recherche sur les paysages sonores et les systèmes d’identification acoustique en milieu urbain.
À quoi sert ce dataset ?
UrbanSound8K est principalement utilisé pour :
- L’entraînement de modèles de reconnaissance et de classification audio en milieu urbain
- Le développement de solutions pour la surveillance de la pollution sonore
- L’amélioration des systèmes embarqués capables d’identifier les sons ambiants (villes intelligentes, sécurité publique)
- La recherche en acoustique environnementale et en écologie sonore urbaine
Peut-on l’enrichir ou l’améliorer ?
Oui, plusieurs possibilités existent :
- Ajouter des sons urbains issus d’autres régions géographiques ou climatiques
- Enrichir les annotations avec des métadonnées contextuelles supplémentaires (heure, météo, trafic)
- Mixer ou superposer des sons pour simuler des environnements acoustiques complexes
- Tester la robustesse des modèles avec des sons dégradés (bruit, distorsions, etc.)
🔗 Source : UrbanSound8K Dataset
Questions fréquemment posées
UrbanSound8K peut-il être utilisé pour des applications commerciales ?
Oui, sous réserve de respecter les conditions de la licence CC BY 4.0, notamment l’attribution appropriée aux auteurs.
Existe-t-il une version plus étendue du dataset ?
Oui, UrbanSound propose également UrbanSound8K et UrbanSoundClassification (une version élargie avec d’autres extraits et annotations).
Les enregistrements sont-ils représentatifs de toutes les grandes villes ?
Les sons proviennent principalement de New York, mais sont assez typiques des environnements urbains globaux. Pour une diversité géographique accrue, une combinaison avec d’autres corpus est recommandée.