En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Open Datasets
MIMIC-III
Medical

MIMIC-III

MIMIC-III (Medical Information Mart for Intensive Care) est un dataset hospitalier de référence regroupant des données cliniques détaillées de patients admis en soins intensifs. Développé par le MIT, il est largement utilisé pour la recherche médicale, l’analyse de trajectoires de soins, et le développement d’outils prédictifs en santé.

Télécharger le dataset
Taille

Plus de 40000 dossiers de patients, formats CSV

Licence

Accès restreint, réservé à la recherche académique, sous conditions d’authentification et d’acceptation de l'accord de confidentialité PhysioNet

Description


Le dataset contient :

  • Données de plus de 40 000 patients hospitalisés en soins intensifs (ICU)
  • Informations démographiques, diagnostics (CIM-9), prescriptions, résultats de laboratoire
  • Données temporelles : constantes vitales, courbes, interventions, durée d’hospitalisation
  • Fichiers disponibles en CSV pour une intégration directe dans les environnements d’analyse

MIMIC-III couvre une période de 2001 à 2012 et garantit l’anonymisation complète des patients.

À quoi sert ce dataset ?


MIMIC-III est couramment utilisé pour :

  • L’analyse des parcours de soins en réanimation
  • L’entraînement de modèles prédictifs de mortalité, rechute, ou durée de séjour
  • La recherche en médecine de précision et en gestion hospitalière
  • Le développement de systèmes d’aide à la décision clinique (CDSS)
  • L’étude des relations entre traitements, diagnostics et résultats

Peut-on l’enrichir ou l’améliorer ?


Oui, avec plusieurs axes :

  • Intégration de données non structurées (notes cliniques, imagerie)
  • Ajout de variables issues de dispositifs connectés ou courbes physiologiques
  • Croisement avec d’autres bases (MIMIC-CXR pour imagerie, eICU pour extension multisite)
  • Développement de benchmarks sur des tâches spécifiques (prédiction, clustering, NLP médical)

🔗 Source : MIMIC-III Dataset

Questions fréquemment posées

Le dataset contient-il des données temporelles ?

Oui, une grande partie des données est temporelle (signaux vitaux, interventions, prescriptions) et peut être utilisée pour des modèles séquentiels.

Quelle est la différence entre MIMIC-III et MIMIC-IV ?

MIMIC-IV est une version plus récente, enrichie et restructurée de MIMIC-III, incluant des données postérieures à 2012 avec une meilleure organisation des tables.

Faut-il une formation éthique pour y accéder ?

Oui. L’accès nécessite une formation aux bonnes pratiques de recherche (CITI Program) ainsi qu’un accord signé sur la confidentialité et les conditions d’usage.

Datasets similaires

Voir plus
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.