FreshRetailNet-50k: predicción de la demanda minorista de alimentos
Datos masivos de venta minorista de alimentos sobre 50 000 referencias con seguimiento de existencias agotadas, clima, promociones y más.
4,85 millones de ejemplos por hora, formato tabular estructurado (CSV/parquet)
CC BY 4.0
Descripción
FreshRetailNet - 50 000 es un punto de referencia único para predecir la demanda en el sector minorista de alimentos. Contiene 50 000 series cronológicas detalladas de 90 días, que abarcan las ventas por hora de productos perecederos en 898 tiendas de 18 ciudades principales. El conjunto de datos también incluye información sobre los desabastecimientos, las promociones, el clima y los días festivos.
¿Para qué sirve este conjunto de datos?
- Mejora de los modelos de previsión de la demanda en el sector minorista de alimentos
- Pruebe los algoritmos de detección de demanda latente y de desabastecimiento
- Entrene modelos de series temporales contextuales a gran escala
¿Se puede enriquecer o mejorar?
Sí, este corpus se puede enriquecer con datos de costos logísticos, márgenes o datos externos (eventos, tendencias regionales). También es posible anotarlo con más precisión para refinar la detección de averías ocultas o añadir puntuaciones de confianza a las predicciones de ventas.
🔎 En resumen
🧠 Recomendado para
- Científicos de datos de la cadena de suministro
- Equipos de precios y pronósticos
- Investigadores de series temporales
🔧 Herramientas compatibles
- PyTorch Forecasting
- GluonTS
- Prophet
- LightGBM
- XGBoost
💡 Consejo
Para obtener mejores resultados, agregue los datos horarios por franjas horarias fijas (por ejemplo, por la mañana o por la tarde) según los productos
Preguntas frecuentes
¿Este conjunto de datos cubre varios tipos de productos?
Sí, contiene más de 860 referencias de productos perecederos, clasificados por categorías y subcategorías.
¿Podemos identificar los efectos de las promociones en los datos?
Absolutamente. El conjunto de datos incluye un indicador de promoción y una tasa de descuento para cada entrada.
¿Se puede usar para modelos en tiempo real?
Sí, cada línea tiene una marca de tiempo y se puede usar para simulaciones o despliegues continuos para modelos en tiempo real.




