Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Texto

LexGLUE

LexGlue es un punto de referencia de PNL dedicado al campo legal, diseñado para evaluar el desempeño de los modelos en tareas como la clasificación de decisiones, la predicción de artículos violados o preguntas frecuentes legales. Combina siete subconjuntos de datos, cada uno con un objetivo específico, para promover la aparición de modelos multitarea eficientes en el campo del derecho.

Obtén el dataset
Tamaño

Más de 7 subconjuntos de datos (classif., QA), archivos JSON y miles de documentos legales anotados

Licencia

CC-BY 4.0

Descripción

LexGLUE es un punto de referencia legal de la PNL que combina siete subconjuntos de datos que cubren diferentes jurisdicciones (UE, EE. UU.) y tareas (clasificación multietiqueta, MCQ, predicción de artículos legales, etc.). Permite evaluar modelos «básicos» para diversas tareas jurídicas, como GLUE o SuperGlue, pero dedicadas al ámbito jurídico. Cada conjunto de datos se ha procesado previamente para facilitar su uso por parte de los investigadores o profesionales de la IA legal.

¿Para qué sirve este conjunto de datos?

  • Probar la solidez de los modelos multitarea en un marco legal realista
  • Capacite a un LLM para que comprenda, archive o razone sobre los documentos legales
  • Desarrollar sistemas LegalTech (análisis contractual, predicción de decisiones, etc.)

¿Se puede enriquecer o mejorar?

Sí, LexGlue se puede enriquecer añadiendo nuevas jurisdicciones o formatos de anotación (por ejemplo, resumen de argumentos, decisiones mayoritarias o minoritarias). Su formato modular también facilita la fusión con otros organismos legales para una formación más completa. También se puede utilizar como base para la adaptación a contextos francófonos o multilingües mediante la traducción controlada.

🔎 En resumen

Criterio Evaluación
🧩 Facilidad de uso⭐⭐⭐⭐✩ (Bien estructurado con scripts proporcionados)
🧼 Necesidad de limpieza⭐⭐⭐⭐⭐ (Bajo – datos listos para usar)
🏷️ Riqueza de anotaciones⭐⭐⭐⭐⭐ (Excelente – varios tipos de anotaciones según la tarea)
📜 Licencia comercial✅ Sí (CC-BY 4.0)
👨‍💻 Ideal para principiantes⚠️ Medio – mejor para proyectos estructurados
🔁 Reutilizable para fine-tuning🎯 Perfecto para adaptar un modelo a casos de uso Legal AI
🌍 Diversidad cultural⚡ Moderado – enfoque en derecho europeo y estadounidense

🧠 Recomendado para

  • Laboratorios legales de IA
  • Editores de LegalTech
  • Investigadores de derecho comparado

🔧 Herramientas compatibles

  • Hugging Face Transformers
  • PyTorch
  • DeBERTa
  • Legal-BERT
  • LoRA

💡 Consejo

Comience con una tarea sencilla (por ejemplo, LEDGAR) para probar la solidez de su modelo antes de abordar casos complejos como CaseHold o ECThR.

Preguntas frecuentes

¿LexGlue contiene datos multilingües?

No, todos los subconjuntos de datos están en inglés, pero algunos se pueden traducir o adaptar para otras jurisdicciones.

¿Se puede utilizar este punto de referencia para modelos no legales?

Sí, LexGlue permite evaluar la capacidad de los modelos generales para adaptarse a los textos técnicos o legales.

¿Existe una jerarquía entre los subconjuntos de datos para estructurar la formación?

Sí, algunos subconjuntos de datos son más simples (LEDGAR), otros son más complejos (CaseHold): se recomienda combinarlos gradualmente.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.