Pronóstico de ventas de comestibles de Corporación Favorita
RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto l...
- Autores:
-
Jaramillo Mira, Alejandro
Gutiérrez Muriel, Juan Pablo
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2021
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/25073
- Acceso en línea:
- http://hdl.handle.net/10495/25073
- Palabra clave:
- Técnicas de predicción
Forecasting techniques
Redes neurales (computadores)
Neural networks (Computer science)
Inteligencia artificial
Artificial intelligence
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/2.5/co/
| id |
UDEA2_799b123926a517f3132cc322f8477216 |
|---|---|
| oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/25073 |
| network_acronym_str |
UDEA2 |
| network_name_str |
Repositorio UdeA |
| repository_id_str |
|
| dc.title.spa.fl_str_mv |
Pronóstico de ventas de comestibles de Corporación Favorita |
| title |
Pronóstico de ventas de comestibles de Corporación Favorita |
| spellingShingle |
Pronóstico de ventas de comestibles de Corporación Favorita Técnicas de predicción Forecasting techniques Redes neurales (computadores) Neural networks (Computer science) Inteligencia artificial Artificial intelligence |
| title_short |
Pronóstico de ventas de comestibles de Corporación Favorita |
| title_full |
Pronóstico de ventas de comestibles de Corporación Favorita |
| title_fullStr |
Pronóstico de ventas de comestibles de Corporación Favorita |
| title_full_unstemmed |
Pronóstico de ventas de comestibles de Corporación Favorita |
| title_sort |
Pronóstico de ventas de comestibles de Corporación Favorita |
| dc.creator.fl_str_mv |
Jaramillo Mira, Alejandro Gutiérrez Muriel, Juan Pablo |
| dc.contributor.advisor.none.fl_str_mv |
Quiza Montealegre, Jhon Jair |
| dc.contributor.author.none.fl_str_mv |
Jaramillo Mira, Alejandro Gutiérrez Muriel, Juan Pablo |
| dc.subject.lemb.none.fl_str_mv |
Técnicas de predicción Forecasting techniques Redes neurales (computadores) Neural networks (Computer science) Inteligencia artificial Artificial intelligence |
| topic |
Técnicas de predicción Forecasting techniques Redes neurales (computadores) Neural networks (Computer science) Inteligencia artificial Artificial intelligence |
| description |
RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto la empresa brindó datos de unidades de productos vendidos durante un lapso de aproximadamente 19 meses, que abarcaban meses del año 2016 y parte del 2017. Adicionalmente la empresa puso a disposición otro tipo de datos complementarios, como información de las tiendas, información de la agrupación de sus productos, información histórica del precio del petróleo y de los días festivos en Ecuador, factores que pueden llegar a ser complementarios para predecir el comportamiento de las ventas de los productos. Para comenzar a trabajar los datos primero se hizo una exploración de estos, que facilitara su entendimiento y permitiera tener una familiaridad con estos y con el comportamiento del negocio en general. A su vez se prepararon los datasets de forma que fuese posible trabajarlos y analizarlos con modelos predictivos usando Python como herramienta. Luego de conocer y preparar los datos se comenzó con una primera fase de modelos predictivos, pero únicamente intentando predecir el número total de ventas por periodo de tiempo, sin discriminarlo aún por tipo de productos, para estas primeras iteraciones se construyeron modelos ARIMA que permitieran analizar las ventas como serie de tiempo y un modelo LSTM. Estos modelos permitieron obtener resultados prometedores para el análisis. Posteriormente, en la siguiente etapa de iteraciones se discriminaron las predicciones de ventas por tipo de producto. Para esto se construyeron y se compararon 4 modelos, basados en modelos como CNN, LSTM, LSTM-CNN. Estos modelos mostraron buenos resultados y finalmente se escogió CNN-LSTM como el modelo más acorde; con este se obtuvo un valor de RMSE en el conjunto de datos de 9 entrenamiento de 0.5598231404074386, y un valor de RMSE en el conjunto de datos de validación de 0.5600565469166683. |
| publishDate |
2021 |
| dc.date.accessioned.none.fl_str_mv |
2021-12-14T18:45:22Z |
| dc.date.available.none.fl_str_mv |
2021-12-14T18:45:22Z |
| dc.date.issued.none.fl_str_mv |
2021 |
| dc.type.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Especialización |
| dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_46ec |
| dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/COther |
| dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
| dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/other |
| dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/draft |
| format |
http://purl.org/coar/resource_type/c_46ec |
| status_str |
draft |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10495/25073 |
| url |
http://hdl.handle.net/10495/25073 |
| dc.language.iso.spa.fl_str_mv |
spa |
| language |
spa |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ |
| dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ https://creativecommons.org/licenses/by-nc-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
| eu_rights_str_mv |
openAccess |
| dc.format.extent.spa.fl_str_mv |
39 |
| dc.format.mimetype.spa.fl_str_mv |
application/pdf |
| dc.publisher.spa.fl_str_mv |
Universidad de Antioquia |
| dc.publisher.place.spa.fl_str_mv |
Medellín |
| dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos |
| institution |
Universidad de Antioquia |
| bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstreams/814d170a-be66-4d96-ba03-93de9fffc964/download https://bibliotecadigital.udea.edu.co/bitstreams/6fcdaf05-0d38-43b3-b5af-4db497a2d150/download https://bibliotecadigital.udea.edu.co/bitstreams/b6acb2ac-5cde-460d-b71d-7d0bc62ac9c4/download https://bibliotecadigital.udea.edu.co/bitstreams/a96ae487-70ab-46ce-a60b-3868900d2859/download https://bibliotecadigital.udea.edu.co/bitstreams/bb30d990-96b8-4b89-8593-78933f424233/download |
| bitstream.checksum.fl_str_mv |
b5c8440381064021f7e154233e4a1713 e2060682c9c70d4d30c83c51448f4eed 8a4605be74aa9ea9d79846c1fba20a33 9c5a46d6e496d46aa16c2d433adc61d1 47f3fa0bc33e3b31e401845adc8b4814 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad de Antioquia |
| repository.mail.fl_str_mv |
aplicacionbibliotecadigitalbiblioteca@udea.edu.co |
| _version_ |
1851052623933734912 |
| spelling |
Quiza Montealegre, Jhon JairJaramillo Mira, AlejandroGutiérrez Muriel, Juan Pablo2021-12-14T18:45:22Z2021-12-14T18:45:22Z2021http://hdl.handle.net/10495/25073RESUMEN : En esta monografía se propone una estrategia para la solución al problema publicado en Kaggle por la empresa Corporación Favorita, el cual consiste en poder predecir la cantidad de unidades vendidas por producto de Corporación Favorita en sus tiendas ubicadas en Ecuador, para este 8 reto la empresa brindó datos de unidades de productos vendidos durante un lapso de aproximadamente 19 meses, que abarcaban meses del año 2016 y parte del 2017. Adicionalmente la empresa puso a disposición otro tipo de datos complementarios, como información de las tiendas, información de la agrupación de sus productos, información histórica del precio del petróleo y de los días festivos en Ecuador, factores que pueden llegar a ser complementarios para predecir el comportamiento de las ventas de los productos. Para comenzar a trabajar los datos primero se hizo una exploración de estos, que facilitara su entendimiento y permitiera tener una familiaridad con estos y con el comportamiento del negocio en general. A su vez se prepararon los datasets de forma que fuese posible trabajarlos y analizarlos con modelos predictivos usando Python como herramienta. Luego de conocer y preparar los datos se comenzó con una primera fase de modelos predictivos, pero únicamente intentando predecir el número total de ventas por periodo de tiempo, sin discriminarlo aún por tipo de productos, para estas primeras iteraciones se construyeron modelos ARIMA que permitieran analizar las ventas como serie de tiempo y un modelo LSTM. Estos modelos permitieron obtener resultados prometedores para el análisis. Posteriormente, en la siguiente etapa de iteraciones se discriminaron las predicciones de ventas por tipo de producto. Para esto se construyeron y se compararon 4 modelos, basados en modelos como CNN, LSTM, LSTM-CNN. Estos modelos mostraron buenos resultados y finalmente se escogió CNN-LSTM como el modelo más acorde; con este se obtuvo un valor de RMSE en el conjunto de datos de 9 entrenamiento de 0.5598231404074386, y un valor de RMSE en el conjunto de datos de validación de 0.5600565469166683.ABSTRACT : This monograph proposes a strategy for solving the problem published in Kaggle by the Corporación Favorita company, which consists of being able to predict the number of units sold per Corporación Favorita product in its stores located in Ecuador, for this challenge the company 10 provided data of units of products sold during a period of time of approximately 19 months, covering months of the year 2016 and part of 2017. Additionally, the company made available other types of complementary data, such as information on stores, information on the grouping of its products, historical information on the price of oil and public holidays in Ecuador, factors that may become complementary to predict the behavior of product sales. To begin working on the data, an exploration of these was first made, which would help facilitate their understanding and allow them to have a familiarity with them and with the behavior of the business in general. In turn, the datasets were prepared in such a way that it was possible to work on them and analyze them with predictive models using Python as a tool. After knowing and preparing the data, a first phase of predictive models began, but only trying to predict the total number of sales per period of time, without still discriminating by type of products, for these first iterations ARIMA models were built that allowed to analyze sales as a time series and an LSTM model. Which allowed us to obtain promising results for the analysis. Later, in the next stage of iterations, sales were included in the analysis by period of time, it was wanted to discriminate sales by product type, for this, 4 models were built and compared with each other using neural networks, models such as CNN, LSTM, LSTM + CNN, which showed good results. Which showed good results and finally CNN-LSTM was chosen as the model most consistent with metrics: Train rmse: 0.5598231404074386 and Validation rmse: 0.5600565469166683 Keywords: Corporación Favorita, Predictive Models, ARIMA, LSTM, CNN.EspecializaciónEspecialista en Analítica y Ciencia de Datos39application/pdfspaUniversidad de AntioquiaMedellínFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datoshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Pronóstico de ventas de comestibles de Corporación FavoritaTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftTécnicas de predicciónForecasting techniquesRedes neurales (computadores)Neural networks (Computer science)Inteligencia artificialArtificial intelligencePublicationORIGINALJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdfJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdfTrabajo de grado de especializaciónapplication/pdf783985https://bibliotecadigital.udea.edu.co/bitstreams/814d170a-be66-4d96-ba03-93de9fffc964/downloadb5c8440381064021f7e154233e4a1713MD512trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/6fcdaf05-0d38-43b3-b5af-4db497a2d150/downloade2060682c9c70d4d30c83c51448f4eedMD510falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/b6acb2ac-5cde-460d-b71d-7d0bc62ac9c4/download8a4605be74aa9ea9d79846c1fba20a33MD514falseAnonymousREADTEXTJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.txtJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.txtExtracted texttext/plain32229https://bibliotecadigital.udea.edu.co/bitstreams/a96ae487-70ab-46ce-a60b-3868900d2859/download9c5a46d6e496d46aa16c2d433adc61d1MD515falseAnonymousREADTHUMBNAILJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.jpgJuanPabloGutierrezMuriel_2021_PrediccionVentasUnidades.pdf.jpgGenerated Thumbnailimage/jpeg6362https://bibliotecadigital.udea.edu.co/bitstreams/bb30d990-96b8-4b89-8593-78933f424233/download47f3fa0bc33e3b31e401845adc8b4814MD516falseAnonymousREAD10495/25073oai:bibliotecadigital.udea.edu.co:10495/250732025-03-27 01:13:53.297http://creativecommons.org/licenses/by-nc-sa/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
