LexGLUE
LexGlue es un punto de referencia de PNL dedicado al campo legal, diseñado para evaluar el desempeño de los modelos en tareas como la clasificación de decisiones, la predicción de artículos violados o preguntas frecuentes legales. Combina siete subconjuntos de datos, cada uno con un objetivo específico, para promover la aparición de modelos multitarea eficientes en el campo del derecho.
Más de 7 subconjuntos de datos (classif., QA), archivos JSON y miles de documentos legales anotados
CC-BY 4.0
Descripción
LexGLUE es un punto de referencia legal de la PNL que combina siete subconjuntos de datos que cubren diferentes jurisdicciones (UE, EE. UU.) y tareas (clasificación multietiqueta, MCQ, predicción de artículos legales, etc.). Permite evaluar modelos «básicos» para diversas tareas jurídicas, como GLUE o SuperGlue, pero dedicadas al ámbito jurídico. Cada conjunto de datos se ha procesado previamente para facilitar su uso por parte de los investigadores o profesionales de la IA legal.
¿Para qué sirve este conjunto de datos?
- Probar la solidez de los modelos multitarea en un marco legal realista
- Capacite a un LLM para que comprenda, archive o razone sobre los documentos legales
- Desarrollar sistemas LegalTech (análisis contractual, predicción de decisiones, etc.)
¿Se puede enriquecer o mejorar?
Sí, LexGlue se puede enriquecer añadiendo nuevas jurisdicciones o formatos de anotación (por ejemplo, resumen de argumentos, decisiones mayoritarias o minoritarias). Su formato modular también facilita la fusión con otros organismos legales para una formación más completa. También se puede utilizar como base para la adaptación a contextos francófonos o multilingües mediante la traducción controlada.
🔎 En resumen
🧠 Recomendado para
- Laboratorios legales de IA
- Editores de LegalTech
- Investigadores de derecho comparado
🔧 Herramientas compatibles
- Hugging Face Transformers
- PyTorch
- DeBERTa
- Legal-BERT
- LoRA
💡 Consejo
Comience con una tarea sencilla (por ejemplo, LEDGAR) para probar la solidez de su modelo antes de abordar casos complejos como CaseHold o ECThR.
Preguntas frecuentes
¿LexGlue contiene datos multilingües?
No, todos los subconjuntos de datos están en inglés, pero algunos se pueden traducir o adaptar para otras jurisdicciones.
¿Se puede utilizar este punto de referencia para modelos no legales?
Sí, LexGlue permite evaluar la capacidad de los modelos generales para adaptarse a los textos técnicos o legales.
¿Existe una jerarquía entre los subconjuntos de datos para estructurar la formación?
Sí, algunos subconjuntos de datos son más simples (LEDGAR), otros son más complejos (CaseHold): se recomienda combinarlos gradualmente.




