Pronóstico de ventas de comestibles de Corporación Favorita

RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto l...

Full description

Autores:
Jaramillo Mira, Alejandro
Gutiérrez Muriel, Juan Pablo
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/25073
Acceso en línea:
http://hdl.handle.net/10495/25073
Palabra clave:
Técnicas de predicción
Forecasting techniques
Redes neurales (computadores)
Neural networks (Computer science)
Inteligencia artificial
Artificial intelligence
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Description
Summary:RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto la empresa brindó datos de unidades de productos vendidos durante un lapso de aproximadamente 19 meses, que abarcaban meses del año 2016 y parte del 2017. Adicionalmente la empresa puso a disposición otro tipo de datos complementarios, como información de las tiendas, información de la agrupación de sus productos, información histórica del precio del petróleo y de los días festivos en Ecuador, factores que pueden llegar a ser complementarios para predecir el comportamiento de las ventas de los productos. Para comenzar a trabajar los datos primero se hizo una exploración de estos, que facilitara su entendimiento y permitiera tener una familiaridad con estos y con el comportamiento del negocio en general. A su vez se prepararon los datasets de forma que fuese posible trabajarlos y analizarlos con modelos predictivos usando Python como herramienta. Luego de conocer y preparar los datos se comenzó con una primera fase de modelos predictivos, pero únicamente intentando predecir el número total de ventas por periodo de tiempo, sin discriminarlo aún por tipo de productos, para estas primeras iteraciones se construyeron modelos ARIMA que permitieran analizar las ventas como serie de tiempo y un modelo LSTM. Estos modelos permitieron obtener resultados prometedores para el análisis. Posteriormente, en la siguiente etapa de iteraciones se discriminaron las predicciones de ventas por tipo de producto. Para esto se construyeron y se compararon 4 modelos, basados en modelos como CNN, LSTM, LSTM-CNN. Estos modelos mostraron buenos resultados y finalmente se escogió CNN-LSTM como el modelo más acorde; con este se obtuvo un valor de RMSE en el conjunto de datos de 9 entrenamiento de 0.5598231404074386, y un valor de RMSE en el conjunto de datos de validación de 0.5600565469166683.