RL Mixed Dataset – Images et problèmes mathématiques pour apprentissage par renforcement
Dataset combiné à partir de geometry3k et math12k, comprenant images associées à des problèmes mathématiques et leurs réponses.
Environ 3600 images PNG avec problèmes et réponses en format texte
MIT
Description
RL Mixed Dataset est une combinaison de deux jeux de données mathématiques contenant des images, des problèmes textuels et leurs réponses. Il s'agit d'un corpus d'environ 3600 exemples destinés à l'entraînement de modèles multimodaux, particulièrement dans le cadre d'apprentissage par renforcement.
À quoi sert ce dataset ?
- Entraîner des modèles multimodaux à résoudre des problèmes mathématiques avec support visuel
- Développer et tester des algorithmes d’apprentissage par renforcement avec données complexes
- Évaluer la compréhension visuo-textuelle dans des contextes éducatifs ou de recherche
Peut-on l’enrichir ou l’améliorer ?
Oui, il est possible d’ajouter des annotations supplémentaires sur les problèmes, de diversifier les types d’images, ou d’intégrer des variantes linguistiques pour les problèmes et réponses.
🔎 En résumé
🧠 Recommandé pour
- Chercheurs en IA
- Développeurs de cas d'usage utilisant l'IA multimodale
- Éducateurs IA
🔧 Outils compatibles
- PyTorch
- TensorFlow
- RL frameworks
💡 Astuce
Exploitez les splits train/test pour une évaluation rigoureuse des modèles.
Questions fréquemment posées
Ce dataset contient-il des annotations supplémentaires sur les problèmes mathématiques ?
Non, seules les images, les énoncés des problèmes et leurs réponses sont fournies.
Peut-on utiliser ce dataset pour entraîner des modèles non multimodaux ?
Oui, les parties texte peuvent être extraites pour un entraînement en langage seul, mais le dataset est optimisé pour multimodal.
Y a-t-il des contraintes spécifiques liées au format des images ?
Les images sont au format PNG, il est conseillé d’utiliser des frameworks supportant ce format standard.




