En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Open Datasets
Clothing Fit Dataset for Size Recommendation
Texte

Clothing Fit Dataset for Size Recommendation

Dataset d’avis clients enrichi pour prédire si une taille convient, trop petite ou trop grande. Comprend notes, revues, mesures, catégories.

Télécharger le dataset
Taille

82'790 entrées au format JSON (40 Mo), données client-produit structurées avec texte

Licence

CC BY 4.0

Description

Le dataset Clothing Fit Dataset for Size Recommendation regroupe plus de 82'000 avis client concernant des vêtements issus de deux grandes plateformes e-commerce. Il contient des informations sur les notes, les commentaires textuels, les mesures des clients et des produits, ainsi que le retour sur l’ajustement (trop petit, parfait, trop grand). Ce corpus riche permet d’entraîner des modèles pour améliorer l’expérience client dans la mode en ligne.

À quoi sert ce dataset ?

  • Développer un système de recommandation de taille personnalisé pour des sites e-commerce
  • Construire un modèle de classification du "fit" à partir d’avis textuels
  • Créer des modèles de résumé automatique ou d’analyse de sentiment à partir d’avis

Peut-on l’enrichir ou l’améliorer ?

Oui. Il est possible de croiser ce dataset avec des informations démographiques ou des images produit. Des enrichissements peuvent également porter sur l’analyse des sentiments, la normalisation linguistique des avis ou encore l’extension à d’autres marques ou régions. Le format JSON permet une manipulation aisée et des prétraitements avancés.

🔎 En résumé

Critère Évaluation
🧩Facilité d’utilisation ⭐⭐⭐☆☆ (Requiert un certain prétraitement – données textuelles + numériques)
🧼Besoin de nettoyage ⭐☆☆☆☆ (Élevé : sparsité, bruit dans les champs textuels)
🏷️Richesse des annotations ⭐⭐⭐☆☆ (Complète : feedback, notes, catégories, mesures client)
📜Licence commerciale ✅ Oui (CC BY 4.0)
👨‍💻Idéal pour les débutants 👨‍🎓 Avec accompagnement, utile pour projet de fin d’étude
🔁Réutilisable en fine-tuning 🔥 Excellente base pour NLP appliqué à l’e-commerce
🌍Diversité culturelle 🌐 Données orientées US, mais extensibles à d'autres marchés

🧠 Recommandé pour

  • Projets de recommandation
  • Startups e-commerce
  • Analyse marketing

🔧 Outils compatibles

  • Python (pandas, scikit-learn)
  • TensorFlow
  • Hugging Face
  • LightGBM

💡 Astuce

Pensez à regrouper les produits similaires pour lisser les effets de sparsité avant entraînement.

Questions fréquemment posées

Le dataset contient-il des images ou uniquement du texte ?

Il s’agit uniquement de données structurées et textuelles, sans image.

Est-ce que les tailles sont normalisées dans l’ensemble du dataset ?

Oui, les tailles ont été converties en une échelle numérique unifiée pour faciliter la modélisation.

Ce dataset peut-il être utilisé pour créer un assistant virtuel de shopping ?

Absolument, il est bien adapté pour entraîner un modèle de recommandation basé sur l’expérience utilisateur.

Datasets similaires

Voir plus
Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.

Category

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse varius enim in eros elementum tristique.