MIMIC-III
MIMIC-III (Medical Information Mart for Intensive Care) est un dataset hospitalier de référence regroupant des données cliniques détaillées de patients admis en soins intensifs. Développé par le MIT, il est largement utilisé pour la recherche médicale, l’analyse de trajectoires de soins, et le développement d’outils prédictifs en santé.
Plus de 40000 dossiers de patients, formats CSV
Accès restreint, réservé à la recherche académique, sous conditions d’authentification et d’acceptation de l'accord de confidentialité PhysioNet
Description
Le dataset contient :
- Données de plus de 40 000 patients hospitalisés en soins intensifs (ICU)
- Informations démographiques, diagnostics (CIM-9), prescriptions, résultats de laboratoire
- Données temporelles : constantes vitales, courbes, interventions, durée d’hospitalisation
- Fichiers disponibles en CSV pour une intégration directe dans les environnements d’analyse
MIMIC-III couvre une période de 2001 à 2012 et garantit l’anonymisation complète des patients.
À quoi sert ce dataset ?
MIMIC-III est couramment utilisé pour :
- L’analyse des parcours de soins en réanimation
- L’entraînement de modèles prédictifs de mortalité, rechute, ou durée de séjour
- La recherche en médecine de précision et en gestion hospitalière
- Le développement de systèmes d’aide à la décision clinique (CDSS)
- L’étude des relations entre traitements, diagnostics et résultats
Peut-on l’enrichir ou l’améliorer ?
Oui, avec plusieurs axes :
- Intégration de données non structurées (notes cliniques, imagerie)
- Ajout de variables issues de dispositifs connectés ou courbes physiologiques
- Croisement avec d’autres bases (MIMIC-CXR pour imagerie, eICU pour extension multisite)
- Développement de benchmarks sur des tâches spécifiques (prédiction, clustering, NLP médical)
🔗 Source : MIMIC-III Dataset
Questions fréquemment posées
Le dataset contient-il des données temporelles ?
Oui, une grande partie des données est temporelle (signaux vitaux, interventions, prescriptions) et peut être utilisée pour des modèles séquentiels.
Quelle est la différence entre MIMIC-III et MIMIC-IV ?
MIMIC-IV est une version plus récente, enrichie et restructurée de MIMIC-III, incluant des données postérieures à 2012 avec une meilleure organisation des tables.
Faut-il une formation éthique pour y accéder ?
Oui. L’accès nécessite une formation aux bonnes pratiques de recherche (CITI Program) ainsi qu’un accord signé sur la confidentialité et les conditions d’usage.