Clothing Fit Dataset for Size Recommendation
Conjunto de datos de comentarios de clientes enriquecido para predecir si una talla es adecuada, demasiado pequeña o demasiado grande. Incluye notas, reseñas, medidas y categorías.
82.790 entradas en formato JSON (40 MB), datos estructurados de cliente-producto con texto
CC BY 4.0
Descripción
Este conjunto de datos reúne más de 82 000 opiniones de clientes sobre ropa de dos importantes plataformas de comercio electrónico. Contiene información sobre las valoraciones, los comentarios de texto, las medidas de los clientes y los productos, y comentarios sobre el ajuste (demasiado pequeño, perfecto, demasiado grande). Este rico corpus permite formar modelos para mejorar la experiencia del cliente en la moda online.
¿Para qué sirve este conjunto de datos?
- Desarrolle un sistema de recomendación personalizado para sitios de comercio electrónico
- Construir un modelo de clasificación «adecuado» basado en opiniones textuales
- Cree modelos automáticos de análisis de opiniones o resúmenes basados en las reseñas
¿Se puede enriquecer o mejorar?
Sí. Es posible hacer referencias cruzadas de este conjunto de datos con información demográfica o imágenes de productos. Los enriquecimientos también pueden incluir el análisis de las opiniones, la estandarización lingüística de las reseñas o la extensión a otras marcas o regiones. El formato JSON permite un manejo sencillo y un preprocesamiento avanzado.
🔎 En resumen
🧠 Recomendado para
- Proyectos de recomendaciones
- Startups de comercio electrónico
- Análisis de marketing
🔧 Herramientas compatibles
- Python (pandas, scikit-learn)
- TensorFlow
- Cara abrazada
- LightGBM
💡 Consejo
Considera la posibilidad de agrupar productos similares para suavizar los efectos de la escasez antes de entrenar.
Preguntas frecuentes
¿El conjunto de datos contiene imágenes o solo texto?
Son solo datos estructurados y textuales, sin imágenes.
¿Están estandarizados los tamaños en todo el conjunto de datos?
Sí, los tamaños se han convertido a una escala numérica unificada para facilitar el modelado.
¿Se puede usar este conjunto de datos para crear un asistente de compras virtual?
Por supuesto, es muy adecuado para entrenar un modelo de recomendación basado en la experiencia del usuario.