Al hacer clic en "Aceptar", usted acepta que se almacenen cookies en su dispositivo para mejorar la navegación del sitio, analizar su uso y contribuir a nuestros esfuerzos de marketing. Consulte nuestra política de privacidad para más información.  pour plus d'informations.
Open Datasets
Clothing Fit Dataset for Size Recommendation
Texto

Clothing Fit Dataset for Size Recommendation

Conjunto de datos de comentarios de clientes enriquecido para predecir si una talla es adecuada, demasiado pequeña o demasiado grande. Incluye notas, reseñas, medidas y categorías.

Obtén el dataset
Tamaño

82.790 entradas en formato JSON (40 MB), datos estructurados de cliente-producto con texto

Licencia

CC BY 4.0

Descripción

Este conjunto de datos reúne más de 82 000 opiniones de clientes sobre ropa de dos importantes plataformas de comercio electrónico. Contiene información sobre las valoraciones, los comentarios de texto, las medidas de los clientes y los productos, y comentarios sobre el ajuste (demasiado pequeño, perfecto, demasiado grande). Este rico corpus permite formar modelos para mejorar la experiencia del cliente en la moda online.

¿Para qué sirve este conjunto de datos?

  • Desarrolle un sistema de recomendación personalizado para sitios de comercio electrónico
  • Construir un modelo de clasificación «adecuado» basado en opiniones textuales
  • Cree modelos automáticos de análisis de opiniones o resúmenes basados en las reseñas

¿Se puede enriquecer o mejorar?

Sí. Es posible hacer referencias cruzadas de este conjunto de datos con información demográfica o imágenes de productos. Los enriquecimientos también pueden incluir el análisis de las opiniones, la estandarización lingüística de las reseñas o la extensión a otras marcas o regiones. El formato JSON permite un manejo sencillo y un preprocesamiento avanzado.

🔎 En resumen

Criterio Evaluación
🧩Facilidad de uso ⭐⭐⭐☆☆ (Requiere cierto preprocesamiento – datos textuales + numéricos)
🧼Limpieza necesaria ⭐☆☆☆☆ (Alta: dispersión, ruido en campos textuales)
🏷️Riqueza de las anotaciones ⭐⭐⭐☆☆ (Completo: feedback, puntuaciones, categorías, métricas de clientes)
📜Licencia comercial ✅ Sí (CC BY 4.0)
👨‍💻Ideal para principiantes 👨‍🎓 Con guía, útil para proyectos de fin de estudios
🔁Reutilizable para fine-tuning 🔥 Excelente base para NLP aplicado al e-commerce
🌍Diversidad cultural 🌐 Datos orientados a EE. UU., pero ampliables a otros mercados

🧠 Recomendado para

  • Proyectos de recomendaciones
  • Startups de comercio electrónico
  • Análisis de marketing

🔧 Herramientas compatibles

  • Python (pandas, scikit-learn)
  • TensorFlow
  • Cara abrazada
  • LightGBM

💡 Consejo

Considera la posibilidad de agrupar productos similares para suavizar los efectos de la escasez antes de entrenar.

Preguntas frecuentes

¿El conjunto de datos contiene imágenes o solo texto?

Son solo datos estructurados y textuales, sin imágenes.

¿Están estandarizados los tamaños en todo el conjunto de datos?

Sí, los tamaños se han convertido a una escala numérica unificada para facilitar el modelado.

¿Se puede usar este conjunto de datos para crear un asistente de compras virtual?

Por supuesto, es muy adecuado para entrenar un modelo de recomendación basado en la experiencia del usuario.

Otros datasets

Ver más
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.