Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Open Datasets
Respiratory Sound Database
Audio

Respiratory Sound Database

Base de datos de audio de grabaciones pulmonares que incluyen sonidos respiratorios anotados (silbidos, crepitaciones) de 126 pacientes de todas las edades.

Obtén el dataset
Tamaño

1844 archivos (920.wav + 920.txt), anotaciones, diagnósticos y metadatos

Licencia

De uso gratuito para fines de investigación

Descripción

El Base de datos de sonidos respiratorios es una base de audio para el análisis de trastornos respiratorios. Contiene 920 grabaciones realizadas en 126 pacientes con estetoscopios digitales. Cada archivo se anota manualmente para indicar la presencia de ruidos respiratorios anormales, como Crepitaciones Y el Sibilancias. Las grabaciones duran entre 10 y 90 segundos y cubren un total de 5,5 horas de datos.

¿Para qué sirve este conjunto de datos?

  • Entrene modelos para detectar patologías respiratorias como el asma o la EPOC.
  • Automatice la anotación de sonidos médicos para un diagnóstico asistido.
  • Cree aplicaciones de detección móviles o integradas (por ejemplo, estetoscopios inteligentes).

¿Se puede enriquecer o mejorar?

Sí. Es posible completar este conjunto de datos con nuevos registros de otras poblaciones o afecciones clínicas. La adición de anotaciones adicionales (por ejemplo, ubicación pulmonar, intensidad del sonido) reforzaría su utilidad. También se puede utilizar para generar espectrogramas enriquecidos o para hacer referencias cruzadas con datos clínicos.

🔎 En resumen

Criterio Evaluación
🧩Facilidad de uso ⭐⭐⭐☆☆ (Archivos organizados, pero requiere un preprocesamiento de audio)
🧼Necesidad de limpieza ⭐⭐⭐⭐☆ (Baja – datos bien estructurados)
🏷️Riqueza de anotaciones ⭐⭐⭐⭐☆ (Presencia de anotaciones de ciclos/crepitaciones/sibilancias)
📜Licencia comercial ✅ Sí – libremente utilizable para investigación y desarrollo
👨‍💻Ideal para principiantes 👨‍🎓 Sí, si hay acompañamiento para el procesamiento de audio
🔁Reutilizable en fine-tuning 🔥 Muy adecuado para modelos clasificadores de audio
🌍Diversidad cultural 🌍 Muestras procedentes de pacientes europeos (Portugal, Grecia)

🧠 Recomendado para

  • Proyectos de bioacústica
  • Diagnóstico asistido
  • Investigación médica

🔧 Herramientas compatibles

  • Librosa
  • PyTorch
  • Flujo tensor
  • Audacia
  • Libretas Kaggle

💡 Consejo

La conversión de archivos de audio en espectrogramas facilita el entrenamiento de modelos de CNN que con materias primas.

Preguntas frecuentes

¿Este conjunto de datos contiene ejemplos anotados de patologías específicas?

Sí, cada grabación está asociada a anotaciones que informan sobre sonidos anormales, como crepitaciones y silbidos, útiles para la clasificación de patologías.

¿Se pueden usar los archivos para el aprendizaje supervisado?

Sí, los archivos van acompañados de textos de anotación que permiten entrenar a los modelos supervisados con señales de audio.

¿Se puede usar este conjunto de datos para una aplicación móvil de detección respiratoria?

Sí, al adaptar los modelos y optimizar la inferencia, este conjunto de datos es ideal para crear prototipos de aplicaciones móviles o conectadas.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.