Reddit Memes Dataset
Dataset composé de plus de 3300 images de mèmes Reddit, incluant les URL des images, le nombre de votes positifs et négatifs, et d’autres métadonnées. Collecté pour des projets de vision par ordinateur et analyse de popularité.
3327 fichiers image (URL des images + métadonnées JSON associées)
CC0: Public Domain
Description
Le dataset Reddit Memes Dataset contient 3327 images de mèmes issues de Reddit, accompagnées de métadonnées telles que l’ID du post, le nombre de votes positifs et négatifs, ainsi que d’autres informations pertinentes. Ce corpus est un bon point de départ pour des projets de vision par ordinateur liés à l’analyse de contenu humoristique et viralité.
À quoi sert ce dataset ?
- Entraîner des modèles de vision par ordinateur pour la classification d’images humoristiques
- Analyser la popularité et le score d’engagement des mèmes sur les réseaux sociaux
- Développer des systèmes de recommandation ou de modération de contenus visuels
Peut-on l’enrichir ou l’améliorer ?
Oui, on peut ajouter des annotations manuelles sur le contenu des mèmes, comme les catégories humoristiques, le type de mème, ou le contexte culturel. Il est aussi possible d’intégrer des données textuelles extraites des images via OCR pour des analyses multimodales.
🔎 En résumé
🧠 Recommandé pour
- Chercheurs en vision par ordinateur
- Développeurs d’applications sociales
- Data scientists
🔧 Outils compatibles
- PyTorch
- TensorFlow
- OpenCV
- FastAI
💡 Astuce
Utiliser des outils OCR pour exploiter les textes présents dans les images.
Questions fréquemment posées
Ce dataset contient-il les images directement ou seulement leurs URL ?
Le dataset fournit les URL des images, il faut les télécharger séparément.
Peut-on utiliser ce dataset pour entraîner des modèles de reconnaissance d’images humoristiques ?
Oui, il est adapté à la classification et à l’analyse de mèmes en vision par ordinateur.
Le dataset comprend-il des annotations manuelles sur le contenu des mèmes ?
Non, les annotations sont limitées aux métadonnées d’engagement, mais l’ajout d’annotations est possible et conseillé.




