En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Open Datasets
Conjunto de datos TREC-QA
Texto

Conjunto de datos TREC-QA

TREC-QA es un conjunto de datos diseñado para entrenar y evaluar modelos de preguntas y respuestas (QA) en lenguaje natural. Proviene de las conferencias TREC (Text Retrieval Conference) y su objetivo es evaluar la capacidad de los sistemas para proporcionar respuestas precisas a preguntas basadas en hechos a partir de un corpus de documentos.

Obtén el dataset
Tamaño

Varios miles de pares pregunta-respuesta, en formato TXT

Licencia

Uso académico bajo condiciones. Se requiere licencia para algunas versiones comerciales

Descripción


El conjunto de datos TREC-QA incluye:

  • Varios miles de preguntas breves con respuestas objetivas
  • Pasajes de texto que se analizarán para encontrar la respuesta correcta
  • Anotaciones relevantes para la evaluación (respuesta buena/mala)
  • Un formato RAW en TXT o TSV, adecuado para el entrenamiento supervisado

¿Para qué sirve este conjunto de datos?


TREC-QA se utiliza para:

  • Formación de modelos cerrados de preguntas y respuestas (control de calidad cerrado)
  • Evaluación de motores de búsqueda inteligentes basados en lenguaje natural
  • El desarrollo de asistentes virtuales capaces de responder a preguntas objetivas
  • Análisis de la relevancia de las respuestas en las tareas de clasificación

¿Se puede enriquecer o mejorar?


Sí, el TREC-QA se puede adaptar o mejorar:

  • Agregar contextos o explicaciones más ricos asociados a las respuestas
  • Combinación con conjuntos de datos recientes como Natural Questions o HotPotQA
  • Traducción multilingüe para evaluar modelos de control de calidad a otros idiomas
  • Anotación de los tipos de respuesta (persona, ubicación, fecha, cantidad...)

🔗 Fuente: Conjunto de datos TREC-QA

Preguntas frecuentes

¿Cuál es la diferencia entre TREC-QA y sQuad?

sQuad ofrece respuestas extraídas directamente de un contexto determinado, mientras que TREC-QA evalúa la capacidad de elegir la respuesta correcta entre varias, de un corpus más amplio.

¿Se sigue utilizando TREC-QA en la actualidad?

Sí, sigue siendo un punto de referencia histórico para la garantía de calidad basada en hechos y se sigue utilizando en trabajos de comparación o para la evaluación inicial de los modelos de garantía de calidad.

¿Se puede combinar TREC-QA con modelos generativos?

Sí, aunque históricamente esté asociado con la clasificación, se puede adaptar para probar modelos generativos como el GPT o el T5 comparando las respuestas generadas con las esperadas.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.