Pronóstico de ventas de comestibles de Corporación Favorita

RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto l...

Full description

Autores:
Jaramillo Mira, Alejandro
Gutiérrez Muriel, Juan Pablo
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/25073
Acceso en línea:
http://hdl.handle.net/10495/25073
Palabra clave:
Técnicas de predicción
Forecasting techniques
Redes neurales (computadores)
Neural networks (Computer science)
Inteligencia artificial
Artificial intelligence
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
id UDEA2_799b123926a517f3132cc322f8477216
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/25073
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Pronóstico de ventas de comestibles de Corporación Favorita
title Pronóstico de ventas de comestibles de Corporación Favorita
spellingShingle Pronóstico de ventas de comestibles de Corporación Favorita
Técnicas de predicción
Forecasting techniques
Redes neurales (computadores)
Neural networks (Computer science)
Inteligencia artificial
Artificial intelligence
title_short Pronóstico de ventas de comestibles de Corporación Favorita
title_full Pronóstico de ventas de comestibles de Corporación Favorita
title_fullStr Pronóstico de ventas de comestibles de Corporación Favorita
title_full_unstemmed Pronóstico de ventas de comestibles de Corporación Favorita
title_sort Pronóstico de ventas de comestibles de Corporación Favorita
dc.creator.fl_str_mv Jaramillo Mira, Alejandro
Gutiérrez Muriel, Juan Pablo
dc.contributor.advisor.none.fl_str_mv Quiza Montealegre, Jhon Jair
dc.contributor.author.none.fl_str_mv Jaramillo Mira, Alejandro
Gutiérrez Muriel, Juan Pablo
dc.subject.lemb.none.fl_str_mv Técnicas de predicción
Forecasting techniques
Redes neurales (computadores)
Neural networks (Computer science)
Inteligencia artificial
Artificial intelligence
topic Técnicas de predicción
Forecasting techniques
Redes neurales (computadores)
Neural networks (Computer science)
Inteligencia artificial
Artificial intelligence
description RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto la empresa brindó datos de unidades de productos vendidos durante un lapso de aproximadamente 19 meses, que abarcaban meses del año 2016 y parte del 2017. Adicionalmente la empresa puso a disposición otro tipo de datos complementarios, como información de las tiendas, información de la agrupación de sus productos, información histórica del precio del petróleo y de los días festivos en Ecuador, factores que pueden llegar a ser complementarios para predecir el comportamiento de las ventas de los productos. Para comenzar a trabajar los datos primero se hizo una exploración de estos, que facilitara su entendimiento y permitiera tener una familiaridad con estos y con el comportamiento del negocio en general. A su vez se prepararon los datasets de forma que fuese posible trabajarlos y analizarlos con modelos predictivos usando Python como herramienta. Luego de conocer y preparar los datos se comenzó con una primera fase de modelos predictivos, pero únicamente intentando predecir el número total de ventas por periodo de tiempo, sin discriminarlo aún por tipo de productos, para estas primeras iteraciones se construyeron modelos ARIMA que permitieran analizar las ventas como serie de tiempo y un modelo LSTM. Estos modelos permitieron obtener resultados prometedores para el análisis. Posteriormente, en la siguiente etapa de iteraciones se discriminaron las predicciones de ventas por tipo de producto. Para esto se construyeron y se compararon 4 modelos, basados en modelos como CNN, LSTM, LSTM-CNN. Estos modelos mostraron buenos resultados y finalmente se escogió CNN-LSTM como el modelo más acorde; con este se obtuvo un valor de RMSE en el conjunto de datos de 9 entrenamiento de 0.5598231404074386, y un valor de RMSE en el conjunto de datos de validación de 0.5600565469166683.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-12-14T18:45:22Z
dc.date.available.none.fl_str_mv 2021-12-14T18:45:22Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Especialización
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_46ec
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/COther
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/other
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_46ec
status_str draft
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/25073
url http://hdl.handle.net/10495/25073
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
https://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 39
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de Antioquia
dc.publisher.place.spa.fl_str_mv Medellín
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/814d170a-be66-4d96-ba03-93de9fffc964/download
https://bibliotecadigital.udea.edu.co/bitstreams/6fcdaf05-0d38-43b3-b5af-4db497a2d150/download
https://bibliotecadigital.udea.edu.co/bitstreams/b6acb2ac-5cde-460d-b71d-7d0bc62ac9c4/download
https://bibliotecadigital.udea.edu.co/bitstreams/a96ae487-70ab-46ce-a60b-3868900d2859/download
https://bibliotecadigital.udea.edu.co/bitstreams/bb30d990-96b8-4b89-8593-78933f424233/download
bitstream.checksum.fl_str_mv b5c8440381064021f7e154233e4a1713
e2060682c9c70d4d30c83c51448f4eed
8a4605be74aa9ea9d79846c1fba20a33
9c5a46d6e496d46aa16c2d433adc61d1
47f3fa0bc33e3b31e401845adc8b4814
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052623933734912
spelling Quiza Montealegre, Jhon JairJaramillo Mira, AlejandroGutiérrez Muriel, Juan Pablo2021-12-14T18:45:22Z2021-12-14T18:45:22Z2021http://hdl.handle.net/10495/25073RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto la empresa brindó datos de unidades de productos vendidos durante un lapso de aproximadamente 19 meses, que abarcaban meses del año 2016 y parte del 2017. Adicionalmente la empresa puso a disposición otro tipo de datos complementarios, como información de las tiendas, información de la agrupación de sus productos, información histórica del precio del petróleo y de los días festivos en Ecuador, factores que pueden llegar a ser complementarios para predecir el comportamiento de las ventas de los productos. Para comenzar a trabajar los datos primero se hizo una exploración de estos, que facilitara su entendimiento y permitiera tener una familiaridad con estos y con el comportamiento del negocio en general. A su vez se prepararon los datasets de forma que fuese posible trabajarlos y analizarlos con modelos predictivos usando Python como herramienta. Luego de conocer y preparar los datos se comenzó con una primera fase de modelos predictivos, pero únicamente intentando predecir el número total de ventas por periodo de tiempo, sin discriminarlo aún por tipo de productos, para estas primeras iteraciones se construyeron modelos ARIMA que permitieran analizar las ventas como serie de tiempo y un modelo LSTM. Estos modelos permitieron obtener resultados prometedores para el análisis. Posteriormente, en la siguiente etapa de iteraciones se discriminaron las predicciones de ventas por tipo de producto. Para esto se construyeron y se compararon 4 modelos, basados en modelos como CNN, LSTM, LSTM-CNN. Estos modelos mostraron buenos resultados y finalmente se escogió CNN-LSTM como el modelo más acorde; con este se obtuvo un valor de RMSE en el conjunto de datos de 9 entrenamiento de 0.5598231404074386, y un valor de RMSE en el conjunto de datos de validación de 0.5600565469166683.ABSTRACT : This monograph proposes a strategy for solving the problem published in Kaggle by the Corporación Favorita company, which consists of being able to predict the number of units sold per Corporación Favorita product in its stores located in Ecuador, for this challenge the company 10 provided data of units of products sold during a period of time of approximately 19 months, covering months of the year 2016 and part of 2017. Additionally, the company made available other types of complementary data, such as information on stores, information on the grouping of its products, historical information on the price of oil and public holidays in Ecuador, factors that may become complementary to predict the behavior of product sales. To begin working on the data, an exploration of these was first made, which would help facilitate their understanding and allow them to have a familiarity with them and with the behavior of the business in general. In turn, the datasets were prepared in such a way that it was possible to work on them and analyze them with predictive models using Python as a tool. After knowing and preparing the data, a first phase of predictive models began, but only trying to predict the total number of sales per period of time, without still discriminating by type of products, for these first iterations ARIMA models were built that allowed to analyze sales as a time series and an LSTM model. Which allowed us to obtain promising results for the analysis. Later, in the next stage of iterations, sales were included in the analysis by period of time, it was wanted to discriminate sales by product type, for this, 4 models were built and compared with each other using neural networks, models such as CNN, LSTM, LSTM + CNN, which showed good results. Which showed good results and finally CNN-LSTM was chosen as the model most consistent with metrics: Train rmse: 0.5598231404074386 and Validation rmse: 0.5600565469166683 Keywords: Corporación Favorita, Predictive Models, ARIMA, LSTM, CNN.EspecializaciónEspecialista en Analítica y Ciencia de Datos39application/pdfspaUniversidad de AntioquiaMedellínFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datoshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Pronóstico de ventas de comestibles de Corporación FavoritaTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftTécnicas de predicciónForecasting techniquesRedes neurales (computadores)Neural networks (Computer science)Inteligencia artificialArtificial intelligencePublicationORIGINALJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdfJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdfTrabajo de grado de especializaciónapplication/pdf783985https://bibliotecadigital.udea.edu.co/bitstreams/814d170a-be66-4d96-ba03-93de9fffc964/downloadb5c8440381064021f7e154233e4a1713MD512trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/6fcdaf05-0d38-43b3-b5af-4db497a2d150/downloade2060682c9c70d4d30c83c51448f4eedMD510falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/b6acb2ac-5cde-460d-b71d-7d0bc62ac9c4/download8a4605be74aa9ea9d79846c1fba20a33MD514falseAnonymousREADTEXTJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.txtJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.txtExtracted texttext/plain32229https://bibliotecadigital.udea.edu.co/bitstreams/a96ae487-70ab-46ce-a60b-3868900d2859/download9c5a46d6e496d46aa16c2d433adc61d1MD515falseAnonymousREADTHUMBNAILJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.jpgJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.jpgGenerated Thumbnailimage/jpeg6362https://bibliotecadigital.udea.edu.co/bitstreams/bb30d990-96b8-4b89-8593-78933f424233/download47f3fa0bc33e3b31e401845adc8b4814MD516falseAnonymousREAD10495/25073oai:bibliotecadigital.udea.edu.co:10495/250732025-03-27 01:13:53.297http://creativecommons.org/licenses/by-nc-sa/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=