OpenMathReasoning

Un corpus completo para la resolución matemática avanzada, que combina cadenas de razonamiento, selección de generaciones y herramientas de inferencia integradas.

Obtén el dataset

Tamaño

3,2 millones de soluciones CoT, 1,7 millones de soluciones TIR, 566 000 GenSelect, solo 193 000 declaraciones; datos textuales estructurados en JSON

Licencia

CC-BY 4.0

Descripción

‍

Razonamiento matemático abierto es un conjunto de datos de razonamiento matemático a gran escala diseñado para entrenar modelos lingüísticos para resolver problemas complejos de los foros de AoPS. Incluye más de 306 000 afirmaciones únicas, con varios millones de soluciones generadas mediante diversas estrategias: cadenas de pensamiento (CoT), razonamiento con herramientas integradas (TIR) y selección automática de las mejores respuestas (GenSelect). El conjunto de datos está estructurado, validado y va acompañado de una gran cantidad de metadatos (modelo generador, tasa de éxito, etc.).

‍

¿Para qué sirve este conjunto de datos?

‍

Entrene modelos de razonamiento matemático eficientes capaces de resolver problemas de nivel olímpico
Pruebe varios enfoques: CoT, TIR, mayoría de votos, etc.
Optimiza la formación de LLMs especializados en STEM o aplicaciones educativas

‍

¿Se puede enriquecer o mejorar?

‍

Sí, es posible añadir anotaciones humanas para las respuestas generadas, integrar otros corpus matemáticos (por ejemplo, MATH, miniF2F) o estructurar los problemas por tema o nivel. El conjunto de datos también se puede utilizar como base para nuevos puntos de referencia o para modelos de formación en otros idiomas con una traducción adaptada.

‍

🔎 En resumen

Criterio	Evaluación
🧩Facilidad de uso	⭐⭐⭐☆☆ (Datos ricos pero técnicos de manejar)
🧼Necesidad de limpieza	⭐⭐⭐⭐☆ (Baja – Alta calidad, bien formateado)
🏷️Riqueza de las anotaciones	⭐⭐⭐⭐⭐ (Excepcional: CoT, TIR, selección, tasa de éxito)
📜Licencia comercial	✅ Sí (CC-BY 4.0)
👨‍💻Ideal para principiantes	❌ No realmente – Alta complejidad matemática
🔁Reutilizable en fine-tuning	🔥 Excelente para SFT, RLHF, destilación
🌍Diversidad cultural	⚠️ Baja – Problemas provenientes de un único corpus de habla inglesa