Conjunto de datos de análisis de sentimientos de Twitter
El conjunto de datos de análisis de opiniones de Twitter es una base de datos que se usa ampliamente en la PNL para tareas de análisis de opiniones. Contiene más de un millón de tuits anotados según su tono emocional: positivo, negativo o neutral.
Aproximadamente 1,6 millones de tuits comentados, en formato CSV
El uso está sujeto a las condiciones de uso de la API de Twitter. Se requiere verificación para usos comerciales
Descripción
El conjunto de datos de Twitter Sentiment incluye:
- 1,6 millones de tuits de texto anotados en inglés
- Tres clases: positiva, negativa, neutra
- Un formato CSV que se puede usar fácilmente en canalizaciones de PNL
- Metadatos opcionales (según la versión): ID, fecha, nombre de usuario, etc.
¿Para qué sirve este conjunto de datos?
Este conjunto de datos se usa comúnmente para:
- Modelos formativos para la clasificación de los sentimientos en textos breves
- Análisis de tendencias y opiniones en redes sociales
- Monitorización de la reputación online (monitorización de la marca)
- La mejora de los sistemas de moderación, recomendaciones o resúmenes de opiniones
¿Se puede enriquecer o mejorar?
Sí, a pesar de su tamaño, este conjunto de datos se puede enriquecer:
- Adición de subcategorías emocionales (alegría, enfado, sorpresa, etc.)
- Integración de datos contextuales (hashtags, emojis, imágenes)
- Creación de filtros temáticos (política, deporte, salud...)
- Traducción o adaptación para análisis multilingües
🔗 Fuente: Conjunto de datos de opiniones de Twitter
Preguntas frecuentes
¿Siguen disponibles los tuits del conjunto de datos?
No necesariamente. Es posible que algunos se hayan eliminado o se hayan convertido en privados. Se recomienda comprobar su disponibilidad antes de utilizarlos.
¿Se puede utilizar este conjunto de datos en un contexto comercial?
Eso depende de las condiciones de uso de la API de Twitter. Es imprescindible consultar la política de la plataforma antes de la explotación comercial.
¿Hay alternativas más nuevas?
Sí, otros conjuntos de datos como TweetEval o Sentiment140 ofrecen variantes, a veces enriquecidas o más recientes, para usos similares.