Respiratory Sound Database
Base audio d’enregistrements pulmonaires incluant des sons de respiration annotés (sifflements, crépitements) sur 126 patients de tous âges.
1844 fichiers (920 .wav + 920 .txt), annotations, diagnostics et métadonnées
Libre d'utilisation à des fins de recherche
Description
Le Respiratory Sound Database est une base audio destinée à l’analyse des troubles respiratoires. Il contient 920 enregistrements réalisés sur 126 patients à l’aide de stéthoscopes numériques. Chaque fichier est annoté manuellement pour signaler la présence de bruits respiratoires anormaux comme les crackles et les wheezes. Les enregistrements durent entre 10 et 90 secondes, couvrant un total de 5,5 heures de données.
À quoi sert ce dataset ?
- Entraîner des modèles à détecter des pathologies respiratoires telles que l’asthme ou la BPCO.
- Automatiser l’annotation de sons médicaux pour les diagnostics assistés.
- Créer des applications de dépistage mobile ou embarquées (ex. : stéthoscopes intelligents).
Peut-on l’enrichir ou l’améliorer ?
Oui. Il est possible de compléter ce dataset avec de nouveaux enregistrements provenant d’autres populations ou conditions cliniques. L’ajout d’annotations supplémentaires (ex. : localisation pulmonaire, intensité du son) permettrait de renforcer son utilité. Il peut aussi être utilisé pour générer des spectrogrammes enrichis ou être croisé avec des données cliniques.
🔎 En résumé
🧠 Recommandé pour
- Projets en IA et bio-acoustique
- Diagnostic assisté grâce à l'IA
- Recherche médicale
🔧 Outils compatibles
- PyTorch
- Tensorflow
- Kaggle Notebooks
💡 Astuce
Convertir les fichiers audio en spectrogrammes permet d’entraîner des modèles CNN plus facilement que sur le brut.
Questions fréquemment posées
Ce dataset contient-il des exemples annotés de pathologies spécifiques ?
Oui, chaque enregistrement est associé à des annotations signalant des sons anormaux comme les crépitements et sifflements, utiles pour la classification de pathologies.
Est-ce que les fichiers sont exploitables pour un apprentissage supervisé ?
Oui, les fichiers sont accompagnés de textes d’annotation permettant d’entraîner des modèles supervisés sur des signaux audio.
Peut-on utiliser ce dataset pour une application mobile de détection respiratoire ?
Oui, en adaptant les modèles et en optimisant l’inférence, ce dataset est idéal pour prototyper des apps mobiles ou connectées.