Shoplifting Video Dataset
Ce dataset vidéo synthétique propose des scènes simulées de vol à l’étalage et de comportements normaux capturés en environnement réel. Idéal pour la détection d’actions humaines par apprentissage profond.
182 fichiers (vidéos .mp4) – résolution 640×480 – 30 FPS – 2 classes (vol / normal)
CC BY 4.0
Description
Le dataset Shoplifting Video contient des clips vidéo capturés en laboratoire de vision par ordinateur, représentant deux comportements : "normal" (marche, inspection de produits) et "vol à l’étalage" (dissimulation d’objets dans des sacs ou sous les vêtements). Les vidéos sont enregistrées avec une caméra 32 MP, en 640×480, à 30 images/s.
À quoi sert ce dataset ?
- Former des modèles de détection de comportements suspects en magasin
- Tester des algorithmes de reconnaissance d’actions sur flux vidéo
- Créer des prototypes de systèmes de surveillance intelligente
Peut-on l’enrichir ou l’améliorer ?
Oui, on peut compléter ce dataset avec d’autres angles de caméra ou diversifier les scénarios (types de vol, interactions entre personnes). Des annotations supplémentaires (bounding boxes, keypoints) pourraient également être ajoutées pour des modèles multi-tâches (action + localisation).
🔎 En résumé
🧠 Recommandé pour
- Chercheurs en vision par ordinateur
- Projets de vidéosurveillance
- Détection d’anomalies
🔧 Outils compatibles
- OpenCV
- PyTorch Video
- Detectron2
- Kinetics-based pipelines
💡 Astuce
Pour plus de robustesse, coupler ce dataset avec des flux réels ou générés synthétiquement via GANs ou simulations 3D.
Questions fréquemment posées
Ce dataset contient-il des annotations image par image ?
Non, les vidéos sont simplement étiquetées comme “normal” ou “vol”. Il n’y a pas d’annotations temporelles ou spatiales.
Est-il possible d’utiliser ce dataset pour de la détection en temps réel ?
Oui, il peut servir d’entraînement initial pour des modèles de détection d’action sur caméra de surveillance.
Ce dataset est-il adapté pour l’apprentissage supervisé ?
Oui, les vidéos sont classées par étiquette binaire, ce qui permet d’entraîner un classifieur vidéo supervisé.