En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Open Datasets
UrbanSound8K
Audio

UrbanSound8K

Le UrbanSound8K Dataset est une collection d’enregistrements sonores capturés dans différents environnements urbains. Ce corpus est particulièrement utile pour l'entraînement de modèles capables d'identifier et de classifier les sons typiques des villes, comme les sirènes, klaxons, bruits de travaux ou voix humaines.

Télécharger le dataset
Taille

8732 clips audio, format WAV

Licence

Libre sous licence Creative Commons Attribution 4.0 International (CC BY 4.0)

Description


Le dataset propose une variété complète de sons urbains :

  • 8732 clips audio annotés individuellement
  • Durée standardisée de 4 secondes par extrait
  • 10 catégories distinctes : klaxons, sirènes, travaux, enfants jouant, aboiements, moteurs, etc.
  • Enregistrements capturés dans des contextes réels et variés, avec des niveaux sonores réalistes

Il est fréquemment utilisé dans la recherche sur les paysages sonores et les systèmes d’identification acoustique en milieu urbain.

À quoi sert ce dataset ?


UrbanSound8K est principalement utilisé pour :

  • L’entraînement de modèles de reconnaissance et de classification audio en milieu urbain
  • Le développement de solutions pour la surveillance de la pollution sonore
  • L’amélioration des systèmes embarqués capables d’identifier les sons ambiants (villes intelligentes, sécurité publique)
  • La recherche en acoustique environnementale et en écologie sonore urbaine

Peut-on l’enrichir ou l’améliorer ?


Oui, plusieurs possibilités existent :

  • Ajouter des sons urbains issus d’autres régions géographiques ou climatiques
  • Enrichir les annotations avec des métadonnées contextuelles supplémentaires (heure, météo, trafic)
  • Mixer ou superposer des sons pour simuler des environnements acoustiques complexes
  • Tester la robustesse des modèles avec des sons dégradés (bruit, distorsions, etc.)

🔗 Source : UrbanSound8K Dataset

Questions fréquemment posées

UrbanSound8K peut-il être utilisé pour des applications commerciales ?

Oui, sous réserve de respecter les conditions de la licence CC BY 4.0, notamment l’attribution appropriée aux auteurs.

Existe-t-il une version plus étendue du dataset ?

Oui, UrbanSound propose également UrbanSound8K et UrbanSoundClassification (une version élargie avec d’autres extraits et annotations).

Les enregistrements sont-ils représentatifs de toutes les grandes villes ?

Les sons proviennent principalement de New York, mais sont assez typiques des environnements urbains globaux. Pour une diversité géographique accrue, une combinaison avec d’autres corpus est recommandée.

Datasets similaires

Voir plus
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.