Predicción del comportamiento de compra en tiendas de barrio utilizando modelos de machine learning

El proyecto busca evaluar el comportamiento de compra a nivel local, identificando los productos de la canasta familiar con mayor demanda, la base de datos principal se obtiene de la plataforma Kaggle, la cual contiene registros de compras de productos en 2022 para 217 municipios en 5 departamentos...

Full description

Autores:: Arredondo Parra, Jhon Esteban
Erira Sánchez, Gerson Gabriel

Tipo de recurso:: Tesis

Fecha de publicación:: 2025

Institución:: Universidad de Antioquia

Repositorio:: Repositorio UdeA

Idioma:: spa

Description
Summary:	El proyecto busca evaluar el comportamiento de compra a nivel local, identificando los productos de la canasta familiar con mayor demanda, la base de datos principal se obtiene de la plataforma Kaggle, la cual contiene registros de compras de productos en 2022 para 217 municipios en 5 departamentos de Colombia; fue necesario complementar la base de datos con múltiples fuentes externas (plataforma Kaggle, Dane y Fuente propia) que se describen a lo largo de la monografía. Se pretende implementar modelos de Machine Learning, con el fin de ayudar en la identificación de preferencias y demanda frente a distintas categorías de productos para poder proyectar un comportamiento de consumo. Esto proporcionará información relevante a los establecimientos comerciales para que puedan crear estrategias que les permita entrar en mercados potenciales y mejorar sus ventas. Para la implementación de modelos de regresión, previamente se entrenaron distintos modelos de clasificación de productos en categorías, para alimentar el dataset final de predicción. El mejor modelo de clasificación fue el SVC que alcanza una precisión del 96% en la asignación de categorías. Para la predicción de demanda, se ajustan modelos de regresión tanto de machine learning como de Deep learning, sobre un dataset alimentado con variables socioeconómicas, categorías de productos y dos métodos de imputación distintos. Con el primer método de imputación con ceros, los modelos presentan un RMSE de 6 unidades. Para el segundo caso, se usa interpolación lineal obteniendo métricas de un MAPE cercano al 40% y un RMSE de aproximadamente 16 unidades.

Predicción del comportamiento de compra en tiendas de barrio utilizando modelos de machine learning

Publicaciones similares