En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Open Datasets
DCASE Challenge Dataset
Audio

DCASE Challenge Dataset

Le DCASE Challenge Dataset rassemble des enregistrements audio provenant d’environnements du quotidien variés. Conçu spécifiquement pour l’entraînement et l’évaluation de modèles d’identification de scènes sonores, ce dataset sert de référence dans les compétitions internationales dédiées à l'analyse contextuelle acoustique.

Télécharger le dataset
Taille

Plusieurs milliers d’enregistrements audio, format WAV

Licence

Libre pour utilisation académique et recherche (Licence spécifique DCASE)

Description


Le dataset inclut des sons capturés en conditions réelles, provenant notamment :

  • D’espaces publics (parcs, rues, gares, …)
  • D’espaces intérieurs (cafés, bureaux, salles de classe, …)
  • De scènes domestiques ou urbaines typiques
  • De différents pays et contextes culturels

Chaque enregistrement est annoté avec précision pour une utilisation immédiate dans les tâches de classification audio supervisée.

À quoi sert ce dataset ?


Le DCASE Challenge Dataset est utilisé principalement pour :

  • L’entraînement de modèles de reconnaissance de scènes audio (Soundscape Classification)
  • Le développement d’algorithmes robustes pour l’identification du contexte acoustique
  • L’évaluation comparative (benchmark) de performances entre approches acoustiques ou multimodales
  • La création de systèmes de monitoring acoustique intelligents (villes connectées, espaces publics, IoT…)

Peut-on l’enrichir ou l’améliorer ?


Oui, par exemple :

  • En intégrant d’autres corpus audio similaires (UrbanSound8K, ESC-50, AudioSet)
  • En créant des contextes acoustiques plus complexes via superposition ou simulation d'environnements mixtes
  • En enrichissant les annotations par des métadonnées contextuelles additionnelles (heure, météo, type de public…)
  • En testant des scénarios de reconnaissance dans des conditions difficiles (faible qualité audio, bruit intense, etc.)

🔗 Source : DCASE Challenge Dataset

Questions fréquemment posées

Le dataset est-il adapté à un usage commercial ?

Non directement. Son usage est limité à la recherche et à la participation aux challenges DCASE, sauf mention contraire sur le site officiel.

Existe-t-il différentes éditions du dataset DCASE ?

Oui, le dataset évolue chaque année avec de nouvelles éditions proposant des environnements sonores variés et des scénarios de test adaptés.

Comment accéder aux annotations détaillées ?

Les annotations précises sont fournies avec le téléchargement du dataset sur le site officiel DCASE, facilitant son intégration dans des pipelines d’entraînement.

Datasets similaires

Voir plus
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.