Respiratory Sound Database

Base de datos de audio de grabaciones pulmonares que incluyen sonidos respiratorios anotados (silbidos, crepitaciones) de 126 pacientes de todas las edades.

Obtén el dataset

Tamaño

1844 archivos (920.wav + 920.txt), anotaciones, diagnósticos y metadatos

Licencia

De uso gratuito para fines de investigación

Descripción

‍

El Base de datos de sonidos respiratorios es una base de audio para el análisis de trastornos respiratorios. Contiene 920 grabaciones realizadas en 126 pacientes con estetoscopios digitales. Cada archivo se anota manualmente para indicar la presencia de ruidos respiratorios anormales, como Crepitaciones Y el Sibilancias. Las grabaciones duran entre 10 y 90 segundos y cubren un total de 5,5 horas de datos.

‍

¿Para qué sirve este conjunto de datos?

‍

Entrene modelos para detectar patologías respiratorias como el asma o la EPOC.
Automatice la anotación de sonidos médicos para un diagnóstico asistido.
Cree aplicaciones de detección móviles o integradas (por ejemplo, estetoscopios inteligentes).

‍

¿Se puede enriquecer o mejorar?

‍

Sí. Es posible completar este conjunto de datos con nuevos registros de otras poblaciones o afecciones clínicas. La adición de anotaciones adicionales (por ejemplo, ubicación pulmonar, intensidad del sonido) reforzaría su utilidad. También se puede utilizar para generar espectrogramas enriquecidos o para hacer referencias cruzadas con datos clínicos.

‍

🔎 En resumen

Criterio	Evaluación
🧩Facilidad de uso	⭐⭐⭐☆☆ (Archivos organizados, pero requiere un preprocesamiento de audio)
🧼Necesidad de limpieza	⭐⭐⭐⭐☆ (Baja – datos bien estructurados)
🏷️Riqueza de anotaciones	⭐⭐⭐⭐☆ (Presencia de anotaciones de ciclos/crepitaciones/sibilancias)
📜Licencia comercial	✅ Sí – libremente utilizable para investigación y desarrollo
👨‍💻Ideal para principiantes	👨‍🎓 Sí, si hay acompañamiento para el procesamiento de audio
🔁Reutilizable en fine-tuning	🔥 Muy adecuado para modelos clasificadores de audio
🌍Diversidad cultural	🌍 Muestras procedentes de pacientes europeos (Portugal, Grecia)

‍

🧠 Recomendado para

Proyectos de bioacústica
Diagnóstico asistido
Investigación médica

‍

🔧 Herramientas compatibles

Librosa
PyTorch
Flujo tensor
Audacia
Libretas Kaggle

‍

💡 Consejo

La conversión de archivos de audio en espectrogramas facilita el entrenamiento de modelos de CNN que con materias primas.

Preguntas frecuentes

¿Este conjunto de datos contiene ejemplos anotados de patologías específicas?

Sí, cada grabación está asociada a anotaciones que informan sobre sonidos anormales, como crepitaciones y silbidos, útiles para la clasificación de patologías.

¿Se pueden usar los archivos para el aprendizaje supervisado?

Sí, los archivos van acompañados de textos de anotación que permiten entrenar a los modelos supervisados con señales de audio.

¿Se puede usar este conjunto de datos para una aplicación móvil de detección respiratoria?

Sí, al adaptar los modelos y optimizar la inferencia, este conjunto de datos es ideal para crear prototipos de aplicaciones móviles o conectadas.

Otros datasets

Texto

MidJourney v5 Prompt Dataset

Texto

ChatML Format Dolly 15K

Multimodal

WebClick: punto de referencia multimodal para la navegación web