En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Open Datasets
Conjunto de datos de análisis de sentimientos de Twitter
Texto

Conjunto de datos de análisis de sentimientos de Twitter

El conjunto de datos de análisis de opiniones de Twitter es una base de datos que se usa ampliamente en la PNL para tareas de análisis de opiniones. Contiene más de un millón de tuits anotados según su tono emocional: positivo, negativo o neutral.

Obtén el dataset
Tamaño

Aproximadamente 1,6 millones de tuits comentados, en formato CSV

Licencia

El uso está sujeto a las condiciones de uso de la API de Twitter. Se requiere verificación para usos comerciales

Descripción


El conjunto de datos de Twitter Sentiment incluye:

  • 1,6 millones de tuits de texto anotados en inglés
  • Tres clases: positiva, negativa, neutra
  • Un formato CSV que se puede usar fácilmente en canalizaciones de PNL
  • Metadatos opcionales (según la versión): ID, fecha, nombre de usuario, etc.

¿Para qué sirve este conjunto de datos?


Este conjunto de datos se usa comúnmente para:

  • Modelos formativos para la clasificación de los sentimientos en textos breves
  • Análisis de tendencias y opiniones en redes sociales
  • Monitorización de la reputación online (monitorización de la marca)
  • La mejora de los sistemas de moderación, recomendaciones o resúmenes de opiniones

¿Se puede enriquecer o mejorar?


Sí, a pesar de su tamaño, este conjunto de datos se puede enriquecer:

  • Adición de subcategorías emocionales (alegría, enfado, sorpresa, etc.)
  • Integración de datos contextuales (hashtags, emojis, imágenes)
  • Creación de filtros temáticos (política, deporte, salud...)
  • Traducción o adaptación para análisis multilingües

🔗 Fuente: Conjunto de datos de opiniones de Twitter

Preguntas frecuentes

¿Siguen disponibles los tuits del conjunto de datos?

No necesariamente. Es posible que algunos se hayan eliminado o se hayan convertido en privados. Se recomienda comprobar su disponibilidad antes de utilizarlos.

¿Se puede utilizar este conjunto de datos en un contexto comercial?

Eso depende de las condiciones de uso de la API de Twitter. Es imprescindible consultar la política de la plataforma antes de la explotación comercial.

¿Hay alternativas más nuevas?

Sí, otros conjuntos de datos como TweetEval o Sentiment140 ofrecen variantes, a veces enriquecidas o más recientes, para usos similares.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.