PlantVillage
PlantVillage est un jeu de données de référence en agriculture numérique, spécialisé dans la détection des maladies des plantes. Il regroupe des milliers d’images de feuilles de cultures annotées selon leur état de santé, ce qui en fait un outil très utile pour les systèmes d’aide au diagnostic agricole basés sur l’IA.
Environ 54 000 images au format JPEG
Libre pour la recherche académique. Pour un usage commercial, consulter les conditions spécifiques de la licence
Description
Le dataset PlantVillage comprend :
- 54,306 images JPEG de feuilles de plantes
- Des annotations de type classification par culture et par pathologie
- 38 classes couvrant des combinaisons culture-maladie (ex. : tomate – mildiou, pomme de terre – tache brune, etc.)
Les images sont prises sur fond neutre et en conditions contrôlées, ce qui permet une standardisation utile à l’entraînement initial de modèles, avec possibilité de fine-tuning sur des données en conditions réelles.
À quoi sert ce dataset ?
PlantVillage est utilisé pour :
- L’entraînement de modèles de reconnaissance de maladies végétales via images
- La création d’applications mobiles de diagnostic agricole
- Le développement d’outils d’agriculture de précision et de suivi des cultures
- L’amélioration des systèmes d’alerte et de prévention phytosanitaire
Peut-on l’enrichir ou l’améliorer ?
Oui, PlantVillage peut être optimisé par :
- L’ajout d’images en conditions naturelles (terrain, éclairage variable, fond non neutre)
- L’intégration de données contextuelles comme la localisation, le climat ou la saison
- L’ajout de vidéos ou de séries temporelles pour la détection de progression des maladies
- La combinaison avec d’autres sources open source comme PlantDoc ou AgriNet pour un modèle plus robuste
🔗 Source : PlantVillage Dataset
Questions fréquemment posées
PlantVillage peut-il être utilisé en production dans des applications agricoles ?
Oui, après fine-tuning sur des données réelles. Le dataset est très utile en phase de prototypage, mais une adaptation aux conditions locales est essentielle pour une performance optimale en production.
Est-ce que PlantVillage couvre des maladies rares ou émergentes ?
Pas directement. Le dataset se concentre sur les pathologies les plus courantes. Pour les maladies émergentes ou régionales, il peut être nécessaire de collecter de nouvelles données ou d’utiliser des extensions spécialisées.
Peut-on utiliser PlantVillage avec des capteurs embarqués ou drones ?
Oui, mais une étape de réadaptation est requise : les images de PlantVillage étant en fond neutre, il est important de reconstituer un dataset mixte avec des images prises en contexte réel pour généraliser les modèles aux vues aériennes ou en extérieur.