Clothing Fit Dataset for Size Recommendation
Dataset d’avis clients enrichi pour prédire si une taille convient, trop petite ou trop grande. Comprend notes, revues, mesures, catégories.
82'790 entrées au format JSON (40 Mo), données client-produit structurées avec texte
CC BY 4.0
Description
Le dataset Clothing Fit Dataset for Size Recommendation regroupe plus de 82'000 avis client concernant des vêtements issus de deux grandes plateformes e-commerce. Il contient des informations sur les notes, les commentaires textuels, les mesures des clients et des produits, ainsi que le retour sur l’ajustement (trop petit, parfait, trop grand). Ce corpus riche permet d’entraîner des modèles pour améliorer l’expérience client dans la mode en ligne.
À quoi sert ce dataset ?
- Développer un système de recommandation de taille personnalisé pour des sites e-commerce
- Construire un modèle de classification du "fit" à partir d’avis textuels
- Créer des modèles de résumé automatique ou d’analyse de sentiment à partir d’avis
Peut-on l’enrichir ou l’améliorer ?
Oui. Il est possible de croiser ce dataset avec des informations démographiques ou des images produit. Des enrichissements peuvent également porter sur l’analyse des sentiments, la normalisation linguistique des avis ou encore l’extension à d’autres marques ou régions. Le format JSON permet une manipulation aisée et des prétraitements avancés.
🔎 En résumé
🧠 Recommandé pour
- Projets de recommandation
- Startups e-commerce
- Analyse marketing
🔧 Outils compatibles
- Python (pandas, scikit-learn)
- TensorFlow
- Hugging Face
- LightGBM
💡 Astuce
Pensez à regrouper les produits similaires pour lisser les effets de sparsité avant entraînement.
Questions fréquemment posées
Le dataset contient-il des images ou uniquement du texte ?
Il s’agit uniquement de données structurées et textuelles, sans image.
Est-ce que les tailles sont normalisées dans l’ensemble du dataset ?
Oui, les tailles ont été converties en une échelle numérique unifiée pour faciliter la modélisation.
Ce dataset peut-il être utilisé pour créer un assistant virtuel de shopping ?
Absolument, il est bien adapté pour entraîner un modèle de recommandation basé sur l’expérience utilisateur.