RL Mixed Dataset – Images et problèmes mathématiques pour apprentissage par renforcement

Multimodal

RL Mixed Dataset – Images et problèmes mathématiques pour apprentissage par renforcement

Dataset combiné à partir de geometry3k et math12k, comprenant images associées à des problèmes mathématiques et leurs réponses.

Télécharger le dataset

Taille

Environ 3600 images PNG avec problèmes et réponses en format texte

Licence

MIT

Description

‍

RL Mixed Dataset est une combinaison de deux jeux de données mathématiques contenant des images, des problèmes textuels et leurs réponses. Il s'agit d'un corpus d'environ 3600 exemples destinés à l'entraînement de modèles multimodaux, particulièrement dans le cadre d'apprentissage par renforcement.

‍

À quoi sert ce dataset ?

‍

Entraîner des modèles multimodaux à résoudre des problèmes mathématiques avec support visuel
Développer et tester des algorithmes d’apprentissage par renforcement avec données complexes
Évaluer la compréhension visuo-textuelle dans des contextes éducatifs ou de recherche

‍

Peut-on l’enrichir ou l’améliorer ?

‍

Oui, il est possible d’ajouter des annotations supplémentaires sur les problèmes, de diversifier les types d’images, ou d’intégrer des variantes linguistiques pour les problèmes et réponses.

‍

🔎 En résumé

Critère	Évaluation
🧩 Facilité d’utilisation	⭐⭐⭐⭐⭐ (Données bien structurées et facilement accessibles)
🧼 Besoin de nettoyage	⭐⭐⭐⭐⭐ (Faible – images et textes prêts à l’emploi)
🏷️ Richesse des annotations	⭐⭐✩✩✩ (Basique : problème, image, réponse)
📜 Licence commerciale	✅ Oui (MIT)
👨‍💻 Idéal pour les débutants	⚠️ Moyen – nécessite connaissances mathématiques
🔁 Réutilisable en fine-tuning	🎯 Adapté pour apprentissage multimodal et RL
🌍 Diversité culturelle	⚠️ Principalement en anglais, à enrichir