Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Open Datasets
Women’s E-Commerce Clothing Reviews
Texto

Women’s E-Commerce Clothing Reviews

Este conjunto de datos contiene las opiniones de los clientes sobre productos de ropa, incluido el texto libre, las valoraciones, las recomendaciones, las edades y otra información. Te permite trabajar en temas relacionados con la PNL, la clasificación de opiniones o incluso el análisis del comportamiento de compra.

Obtén el dataset
Tamaño

23.486 filas en formato CSV, texto y datos categóricos

Licencia

CC0: Dominio público

Descripción

El conjunto de datos Women’s E-Commerce Clothing Reviews contiene 23.486 opiniones escritas por clientes sobre ropa comprada online. Cada línea corresponde a los comentarios de los clientes, que incluyen información como la valoración otorgada, la edad, el resumen, el texto de la reseña y la información sobre recomendaciones de productos. Todos los datos se anonimizan y se eliminan las referencias a la marca.

¿Para qué sirve este conjunto de datos?

  • Entrene modelos para el análisis de sentimientos o la clasificación de reseñas
  • Realizar estudios de experiencia del cliente por edad o categoría de producto
  • Explore enfoques de PNL como BERT, TF-IDF o Word2Vec en datos reales

¿Se puede enriquecer o mejorar?

Sí, por ejemplo, puedes cruzar estas reseñas con datos externos (precio, existencias, devoluciones), generar etiquetas adicionales (positivas, neutras, negativas) a partir del texto o incluso traducir y adaptar los datos a otros idiomas para su uso multilingüe. La adición del preprocesamiento léxico también mejora el rendimiento del modelo.

🔎 En resumen

Criterio Evaluación
🧩Facilidad de uso ⭐⭐⭐⭐☆ (Muy accesible, formato tabular claro)
🧼Limpieza requerida ⭐⭐☆☆☆ (Baja a moderada: estandarizar textos, eliminar duplicados)
🏷️Riqueza de anotaciones ⭐⭐⭐⭐☆ (Buena variedad: calificación, recomendación, edad, texto libre)
📜Licencia comercial ✅ Sí (CC0)
👨‍💻Ideal para principiantes 👩‍💻 Sí, perfecto para iniciarse en NLP
🔁Reutilizable para fine-tuning 🔥 Sí, para modelos como BERT o RoBERTa
🌍Diversidad cultural 🌐 Media – origen geográfico no especificado

🧠 Recomendado para

  • Analistas de marketing
  • Estudiantes de PNL
  • Desarrolladores de sistemas de recomendación

🔧 Herramientas compatibles

  • Hugging Face Transformers
  • Scikit-learn
  • SpaCy
  • NLTK

💡 Consejo

Para mejorar la detección de sentimientos, combine la puntuación de recomendación binaria con el análisis semántico del texto.

Preguntas frecuentes

¿Se puede usar este conjunto de datos para entrenar un modelo de recomendación?

Sí, las variables de valoración y recomendación y las características del producto permiten modelar los sistemas de sugerencias.

¿El texto de las reseñas contiene nombres de marcas o empresas?

No, todas las menciones se han anonimizado y se han reemplazado por «minorista».

¿Es adecuado para el análisis multilingüe?

No, el conjunto de datos solo está en inglés, pero se puede traducir o enriquecer para su análisis multilingüe.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.