RL Mixed Dataset : imágenes matemáticas y problemas para el aprendizaje por refuerzo

Multimodal

RL Mixed Dataset : imágenes matemáticas y problemas para el aprendizaje por refuerzo

Conjunto de datos combinado de geometry3k y math12k, que incluye imágenes asociadas a problemas matemáticos y sus respuestas.

Obtén el dataset

Tamaño

Aproximadamente 3.600 imágenes PNG con problemas y respuestas en formato texto

Licencia

MIT

Descripción

‍

RL Mixed Dataset es una combinación de dos conjuntos de datos matemáticos que contienen imágenes, problemas de texto y sus respuestas. Se trata de un corpus de unos 3.600 ejemplos destinados a la formación de modelos multimodales, especialmente en el contexto del aprendizaje por refuerzo.

‍

¿Para qué sirve este conjunto de datos?

‍

Entrene modelos multimodales para resolver problemas matemáticos con apoyo visual
Desarrolle y pruebe algoritmos de aprendizaje por refuerzo con datos complejos
Evaluar la comprensión visual-textual en contextos educativos o de investigación

‍

¿Se puede enriquecer o mejorar?

‍

Sí, es posible añadir anotaciones adicionales a los problemas, diversificar los tipos de imágenes o integrar variantes lingüísticas para los problemas y las respuestas.

‍

🔎 En resumen

Criterio	Evaluación
🧩 Facilidad de uso	⭐⭐⭐⭐⭐ (Datos bien estructurados y fácilmente accesibles)
🧼 Necesidad de limpieza	⭐⭐⭐⭐⭐ (Bajo – imágenes y textos listos para usar)
🏷️ Riqueza de anotaciones	⭐⭐✩✩✩ (Básico: problema, imagen, respuesta)
📜 Licencia comercial	✅ Sí (MIT)
👨‍💻 Ideal para principiantes	⚠️ Moderado – requiere conocimientos matemáticos
🔁 Reutilizable para fine-tuning	🎯 Adecuado para aprendizaje multimodal y RL
🌍 Diversidad cultural	⚠️ Principalmente en inglés, a enriquecer