Histogram of Oriented Gradients (HOG)
L’Histogramme des gradients orientés (HOG) est une méthode de vision par ordinateur utilisée pour détecter des objets dans des images en analysant l’orientation et l’intensité des gradients locaux. Chaque image est divisée en petites régions (cellules), et pour chacune, un histogramme des directions des gradients est calculé, capturant ainsi la structure visuelle locale.
Contexte
Proposée par Dalal et Triggs (2005) pour la détection de piétons, cette méthode est devenue un standard avant l’essor du deep learning. HOG a été largement utilisé dans la détection d’objets, combiné à des classificateurs comme les SVM. Bien que les réseaux de neurones convolutifs (CNN) aient surpassé HOG en précision, il reste pertinent dans des environnements où la simplicité et la rapidité priment.
Applications
- Détection de piétons dans les systèmes d’assistance à la conduite.
- Surveillance vidéo pour identifier des silhouettes.
- Robotique pour reconnaissance d’objets basiques.
Avantages et limites
- ✅ Méthode rapide et interprétable.
- ✅ Ne nécessite pas d’énormes bases de données annotées.
- ❌ Moins performant que le deep learning pour des images complexes.
- ❌ Sensible aux variations de lumière et d’échelle.
L’intérêt principal de HOG est sa simplicité et sa robustesse dans des contextes contraints. Plutôt que d’analyser chaque pixel, l’algorithme met en évidence les structures locales de l’image en résumant la direction dominante des contours. Cela en fait un outil particulièrement adapté à la détection d’objets rigides comme les piétons, les véhicules ou les panneaux.
Historiquement, HOG a représenté une avancée majeure avant l’avènement du deep learning. Couplé à des classifieurs linéaires ou des SVM, il a permis de bâtir des systèmes de détection en temps réel pour la sécurité routière ou la vidéosurveillance. Aujourd’hui, son usage persiste dans les scénarios où la légèreté et la rapidité priment sur la précision maximale.
Cependant, HOG présente des limites notables : la sensibilité aux variations d’échelle et d’éclairage le rend moins performant dans des environnements non contrôlés. De plus, face aux réseaux convolutifs capables d’apprendre automatiquement des descripteurs plus riches, HOG est surtout utilisé comme référence pédagogique et comme solution pragmatique pour les systèmes embarqués.
📚 Références
- Dalal, N., Triggs, B. (2005). Histograms of Oriented Gradients for Human Detection.