Circa - Interpretación de respuestas indirectas en una conversación
El conjunto <strong>de datos Circa</strong> contiene diálogos en inglés que se centran en las preguntas polares (sí/no) y sus respuestas indirectas. Los intercambios se extraen de 10 situaciones sociales distintas y son anotados por varios anotadores para interpretar la respuesta indirecta.
Descripción
Circa es un corpus lingüístico que ayuda a entender cómo interpretar las respuestas indirectas a preguntas cerradas en diversos contextos sociales. Cada ejemplo combina una pregunta polar formulada por una persona (X) y una respuesta indirecta dada por otra (Y), con múltiples anotaciones que indican la interpretación probable.
¿Para qué sirve este conjunto de datos?
- Entrene los modelos de PNL para detectar lo implícito en las respuestas indirectas
- Estudiar las interacciones conversacionales en un contexto social
- Mejorar la comprensión de los asistentes virtuales ante las respuestas no explícitas
¿Se puede enriquecer o mejorar?
Sí, el conjunto de datos se puede ampliar añadiendo otros contextos sociales, idiomas o anotaciones más precisas sobre el tono o la emoción. Las versiones multilingües también serían beneficiosas.
🔎 En resumen
🧠 Recomendado para
- Investigadores de PNL conversacional
- Desarrolladores asistentes virtuales
- Lingüistas computacionales
🔧 Herramientas compatibles
- Hugging Face
- PyTorch
- TensorFlow
- SpaCy
💡 Consejo
Utilice varias anotaciones para calibrar mejor la confianza de las interpretaciones en los modelos.
Preguntas frecuentes
¿Qué tipo de preguntas contiene este conjunto de datos?
Contiene principalmente preguntas cerradas (sí/no) formuladas en una variedad de situaciones sociales.
¿Cómo se anotan las respuestas indirectas?
Cada respuesta es anotada por cinco anotadores, con una mayoría para determinar la interpretación principal.
¿Se puede usar el conjunto de datos para idiomas distintos del inglés?
Actualmente no, pero puede ampliarse o adaptarse a otros idiomas y contextos sociales.




