En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Open Datasets
New York Vehicle Collisions (2014–2023)
Texte

New York Vehicle Collisions (2014–2023)

Données détaillées sur les collisions routières à New York entre 2014 et 2023, utiles pour la modélisation, la prévention et l’analyse statistique.

Télécharger le dataset
Taille

2,9 millions de lignes, CSV

Licence

CC0: Public Domain

Description

Ce dataset couvre l’ensemble des accidents de la route signalés par la police à New York entre 2014 et 2023. Il comprend plus de 2,9 millions d’entrées avec des informations détaillées sur la date, l’heure, le lieu, les victimes, les véhicules impliqués et les facteurs contributifs. Ces données proviennent des formulaires officiels de type MV104-AN et sont mises à jour régulièrement.

À quoi sert ce dataset ?

  • Analyser les tendances d’accidents dans les différentes zones géographiques de NYC
  • Entraîner des modèles prédictifs pour la prévention des collisions
  • Évaluer les facteurs humains, techniques ou environnementaux liés aux accidents

Peut-on l’enrichir ou l’améliorer ?

Oui, les données peuvent être croisées avec des sources externes comme la météo, le trafic ou les infrastructures routières. On peut également corriger les valeurs manquantes, ajouter des catégorisations (jours fériés, heure de pointe…) ou réaliser des agrégations temporelles.

🔎 En résumé

Critère Évaluation
🧩Facilité d’utilisation ⭐⭐⭐☆☆ (Moyennement facile – nécessite un nettoyage initial)
🧼Besoin de nettoyage ⭐⭐⭐☆☆ (Présence de valeurs manquantes à gérer)
🏷️Richesse des annotations ⭐⭐⭐☆☆ (Données détaillées mais sans étiquettes explicites)
📜Licence commerciale ✅ Oui (CC0)
👨‍💻Idéal pour les débutants 🔰 Possible, mais volumétrie élevée à gérer
🔁Réutilisable en fine-tuning 📊 Idéal pour classification ou analyse prédictive
🌍Diversité culturelle 🗽 Spécifique à NYC, mais contexte urbain généralisable

🧠 Recommandé pour

  • Analystes urbains
  • Data scientists travaillant sur des cas d'usage en sécurité routière
  • Projets open data

🔧 Outils compatibles

  • Pandas
  • Spark
  • Tableau
  • BigQuery
  • Scikit-learn

💡 Astuce

Filtrez les accidents graves ou mortels pour des analyses ciblées, et utilisez les coordonnées GPS pour cartographier les points noirs.

Questions fréquemment posées

Peut-on utiliser ces données dans un contexte commercial ?

Oui, la licence CC0 autorise une utilisation commerciale sans restriction.

Ce dataset contient-il des données personnelles ?

Non, toutes les données sont agrégées par événement de collision et ne contiennent aucune information personnelle.

Comment traiter les valeurs manquantes présentes dans le fichier ?

Il est recommandé de supprimer les lignes trop incomplètes ou d’imputer les valeurs manquantes selon le contexte d’analyse.

Datasets similaires

Voir plus
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.