OpenMathReasoning

Corpus complet pour la résolution mathématique avancée, combinant chaînes de raisonnement, sélection de génération et outils d’inférence intégrés.

Télécharger le dataset

Taille

3,2M solutions CoT, 1,7M solutions TIR, 566K GenSelect, 193K énoncés seuls ; données textuelles structurées en JSON

Licence

CC-BY 4.0

Description

‍

OpenMathReasoning est un jeu de données de raisonnement mathématique de grande envergure conçu pour entraîner des modèles de langage à résoudre des problèmes complexes issus des forums AoPS. Il comprend plus de 306 000 énoncés uniques, avec plusieurs millions de solutions générées selon différentes stratégies : chaînes de pensée (CoT), raisonnement avec outils intégrés (TIR) et sélection automatique des meilleures réponses (GenSelect). Le dataset est structuré, validé et accompagné de métadonnées riches (modèle générateur, taux de réussite, etc.).

‍

À quoi sert ce dataset ?

‍

Entraîner des modèles de raisonnement mathématique performants, capables de résoudre des problèmes de niveau olympique
Tester des approches variées : CoT, TIR, vote majoritaire, etc.
Optimiser l’entraînement de LLMs spécialisés dans les STEM ou les applications pédagogiques

‍

Peut-on l’enrichir ou l’améliorer ?

‍

Oui, il est possible d’ajouter des annotations humaines pour les réponses générées, d’intégrer d’autres corpus mathématiques (ex. MATH, MiniF2F), ou encore de structurer les problèmes par thème ou niveau. Le dataset peut aussi servir de base pour de nouveaux benchmarks ou pour entraîner des modèles sur d’autres langues avec traduction adaptée.

‍

🔎 En résumé

Critère	Évaluation
🧩Facilité d’utilisation	⭐⭐⭐☆☆ (Données riches mais techniques à manipuler)
🧼Besoin de nettoyage	⭐⭐⭐⭐☆ (Faible – Qualité élevée, bien formaté)
🏷️Richesse des annotations	⭐⭐⭐⭐⭐ (Exceptionnelle : CoT, TIR, sélection, taux de succès)
📜Licence commerciale	✅ Oui (CC-BY 4.0)
👨‍💻Idéal pour les débutants	❌ Pas vraiment – Complexité mathématique élevée
🔁Réutilisable en fine-tuning	🔥 Excellent pour SFT, RLHF, distillation
🌍Diversité culturelle	⚠️ Faible – Problèmes issus d’un corpus anglophone unique