Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)

En este documento se analiza el impacto de las noticias financieras en el precio del índice del S&P500 entre los años 2019 al 2021. Esto se hizo por medio de un análisis de sentimientos basado en técnicas de procesamiento de lenguaje natural (NLP, por sus siglas en inglés) con el fin de medir la...

Full description

Autores:
Ochoa Ortiz, Brian Steven
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Universidad de Ibagué
Repositorio:
Repositorio Universidad de Ibagué
Idioma:
spa
OAI Identifier:
oai:repositorio.unibague.edu.co:20.500.12313/5259
Acceso en línea:
https://hdl.handle.net/20.500.12313/5259
Palabra clave:
Mercado busátil
Deep Learning
Deep Learning - S&P 500 (2019-2021)
Mercado busátil - S&P 500 (2019-2021)
Análisis de sentimientos
S&P500
Procesamiento de lenguaje natural
Inteligencia artificial
Deep learning
Predicción del mercado bursátil
Sentiment analysis
Natural Language Processing
Stock market prediction
Artificial intelligence
Rights
openAccess
License
http://purl.org/coar/access_right/c_abf2
id UNIBAGUE2_f3c33540d246b9a03b63096ba2018c4d
oai_identifier_str oai:repositorio.unibague.edu.co:20.500.12313/5259
network_acronym_str UNIBAGUE2
network_name_str Repositorio Universidad de Ibagué
repository_id_str
dc.title.spa.fl_str_mv Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
title Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
spellingShingle Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
Mercado busátil
Deep Learning
Deep Learning - S&P 500 (2019-2021)
Mercado busátil - S&P 500 (2019-2021)
Análisis de sentimientos
S&P500
Procesamiento de lenguaje natural
Inteligencia artificial
Deep learning
Predicción del mercado bursátil
Sentiment analysis
Natural Language Processing
Stock market prediction
Artificial intelligence
title_short Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
title_full Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
title_fullStr Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
title_full_unstemmed Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
title_sort Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)
dc.creator.fl_str_mv Ochoa Ortiz, Brian Steven
dc.contributor.advisor.none.fl_str_mv Castro, Hector Javier
dc.contributor.author.none.fl_str_mv Ochoa Ortiz, Brian Steven
dc.contributor.jury.none.fl_str_mv Cruz Bustamante, Luisa Fernanda
dc.subject.armarc.none.fl_str_mv Mercado busátil
Deep Learning
Deep Learning - S&P 500 (2019-2021)
Mercado busátil - S&P 500 (2019-2021)
topic Mercado busátil
Deep Learning
Deep Learning - S&P 500 (2019-2021)
Mercado busátil - S&P 500 (2019-2021)
Análisis de sentimientos
S&P500
Procesamiento de lenguaje natural
Inteligencia artificial
Deep learning
Predicción del mercado bursátil
Sentiment analysis
Natural Language Processing
Stock market prediction
Artificial intelligence
dc.subject.proposal.spa.fl_str_mv Análisis de sentimientos
S&P500
Procesamiento de lenguaje natural
Inteligencia artificial
dc.subject.proposal.eng.fl_str_mv Deep learning
Predicción del mercado bursátil
Sentiment analysis
Natural Language Processing
Stock market prediction
Artificial intelligence
description En este documento se analiza el impacto de las noticias financieras en el precio del índice del S&P500 entre los años 2019 al 2021. Esto se hizo por medio de un análisis de sentimientos basado en técnicas de procesamiento de lenguaje natural (NLP, por sus siglas en inglés) con el fin de medir la polaridad de la información de las noticias financieras para su posterior modelación. Además, con el fin de comparar la precisión de modelos convencionales para la predicción de series de tiempo, como lo es el caso de los modelos ARIMA y sus variantes GARCH, se implementó modelos de deep learning de la serie de redes neuronales recurrentes de tipo long short-term memory (LSTM). Por otro lado se mide el impacto de incluir la polaridad de los sentimientos como una variable adicional en el modelo LSTM y ARIMA para determinar su influencia en la precisión de la predicción del índice. Todo esto busca determinar qué modelo ofrece una mejor precisión en la predicción del índice queriendo hacer un hibrido entre el análisis de sentimientos, la econometría y la inteligencia artificial.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-06-16T14:48:54Z
dc.date.available.none.fl_str_mv 2025-06-16T14:48:54Z
dc.date.issued.none.fl_str_mv 2025
dc.type.none.fl_str_mv Trabajo de grado - Pregrado
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.content.none.fl_str_mv Text
dc.type.driver.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.redcol.none.fl_str_mv http://purl.org/redcol/resource_type/TP
dc.type.version.none.fl_str_mv info:eu-repo/semantics/acceptedVersion
format http://purl.org/coar/resource_type/c_7a1f
status_str acceptedVersion
dc.identifier.citation.none.fl_str_mv Ochoa, B. (2025). Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021) [Trabajo de grado, Universidad de Ibagué]. https://hdl.handle.net/20.500.12313/5259
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12313/5259
identifier_str_mv Ochoa, B. (2025). Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021) [Trabajo de grado, Universidad de Ibagué]. https://hdl.handle.net/20.500.12313/5259
url https://hdl.handle.net/20.500.12313/5259
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.references.none.fl_str_mv Akerlof, G. & Shiller, R. (2010). Espíritus animales: Cómo la psicología humana impulsa la economía y por qué importa para el capitalismo global. Taurus.
AWS. (2023). ¿Qué son las redes neuronales recurrentes? (RNN). Amazon Web Services
AWS. (s.f.). ¿Qué es el Procesamiento de lenguaje natural (NLP)? Amazon Web Services
Chicago Booth. (s.f.). Richard H. Thaler – Behavioral Science and Economics Nobel Laureate. The University of Chicago Booth School of Business
Fuentes, C. (2010). Psicología y comportamiento de los inversionistas: Teoría de los espíritus animales de Keynes, Akerlof y Shiller. Universidad de Chile.
Federal Reserve Bank. (2025). Federal Funds Effective Rate (FEDFUNDS).
Gaitán, J. (2020). Fundamentos de finanzas corporativas. Ediciones de la U.
Gonzalez, M. (2009). Análisis de series de tiempo: Modelos ARIMA
Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural Computation
Hawkins, D. (2003). The problem of overfitting. School of Statistics, Minnesota
IBM. (2024). ¿Qué es el procesamiento de lenguaje natural? IBM Cloud Learn Hud
IBM. (2024). ¿Qué es el análisis de sentimiento? IBM Cloud Learn Hud
IBM. (2024). ¿Qué es el deep learning? IBM Cloud Learn Hud
Ilomäki, J., & Laurila, J. (2018). Animal spirits in forecasting behavior: An experimental study. Journal of Behavioral and Experimental Economics, 75, 1–8.
Keynes, J. (1936). Teoría General de la ocupación, el interés y el dinero. Fondo de cultura económica.
Murphy, J. (1999). Análisis técnico de los mercados financieros: Una guía completa de los métodos y aplicaciones de inversión. Gestión 2000.
Noble, J. (s.f.). ¿Qué son los modelos ARIMA? IBM Cloud Learn Hud.
Shiller, R. (2000). Exuberancia irracional. Princeton University Press
Statistics Easily, (s.f.). Glosario de estadística, análisis de datos y ciencia de datos.
Tetlock. P. (2007). Giving content to investor sentiment: The role od media in the stock market. The Journal of Finance, 62(3).
Pablo García et al. (2021). Avaneces en informática y automática. Decimoquinto Workshop. Departamento de Informática y Automática
dc.rights.accessrights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.rights.license.none.fl_str_mv Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://purl.org/coar/access_right/c_abf2
Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)
https://creativecommons.org/licenses/by-nc/4.0/
dc.format.extent.none.fl_str_mv 61 páginas
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad de Ibagué
dc.publisher.faculty.none.fl_str_mv Ciencias Económicas y Administrativas
dc.publisher.place.none.fl_str_mv Espinal
dc.publisher.program.none.fl_str_mv Economía
publisher.none.fl_str_mv Universidad de Ibagué
institution Universidad de Ibagué
bitstream.url.fl_str_mv https://repositorio.unibague.edu.co/bitstreams/de9dfee5-5246-4ce9-a661-67bd7669561a/download
https://repositorio.unibague.edu.co/bitstreams/4e141a72-7059-4f66-9692-4402f618b92e/download
https://repositorio.unibague.edu.co/bitstreams/4d568b6c-837a-443f-a996-e3c60d3e5e76/download
https://repositorio.unibague.edu.co/bitstreams/f8a94746-c8c9-4ab7-ba8d-c22f984ebfd6/download
https://repositorio.unibague.edu.co/bitstreams/f41d0a26-b19f-469d-bf85-4f140f6af888/download
https://repositorio.unibague.edu.co/bitstreams/db3c3cc2-c782-451f-90cc-bde83092777b/download
https://repositorio.unibague.edu.co/bitstreams/0a81f983-b9a5-4a24-bbee-cbb2c1ab098e/download
bitstream.checksum.fl_str_mv 99b0d99bdce778467acaa682302531dd
257be9f9daab12edc36ad0a82f4272d6
2fa3e590786b9c0f3ceba1b9656b7ac3
3119f94c1f60235a99b27a43c47f55be
3d6585dec9fd79c025ac3cac1840e1e9
8506fe84789bacf0c08da4b72588833c
ced3b647bff126dd9ad2f0c4ea5a2b7d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional Universidad de Ibagué
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1851059976661893120
spelling Castro, Hector Javierfdc7243b-0a3e-4d78-948b-589b7fd09e4e600Ochoa Ortiz, Brian Steven03a1f877-8076-4c4b-b337-27e8333b89dc-1Cruz Bustamante, Luisa Fernanda2c9a25b4-3933-4bf0-b0ba-6b44e3120404-12025-06-16T14:48:54Z2025-06-16T14:48:54Z2025En este documento se analiza el impacto de las noticias financieras en el precio del índice del S&P500 entre los años 2019 al 2021. Esto se hizo por medio de un análisis de sentimientos basado en técnicas de procesamiento de lenguaje natural (NLP, por sus siglas en inglés) con el fin de medir la polaridad de la información de las noticias financieras para su posterior modelación. Además, con el fin de comparar la precisión de modelos convencionales para la predicción de series de tiempo, como lo es el caso de los modelos ARIMA y sus variantes GARCH, se implementó modelos de deep learning de la serie de redes neuronales recurrentes de tipo long short-term memory (LSTM). Por otro lado se mide el impacto de incluir la polaridad de los sentimientos como una variable adicional en el modelo LSTM y ARIMA para determinar su influencia en la precisión de la predicción del índice. Todo esto busca determinar qué modelo ofrece una mejor precisión en la predicción del índice queriendo hacer un hibrido entre el análisis de sentimientos, la econometría y la inteligencia artificial.This document analyzes the impact of financial news on the price of the S&P 500 index between 2019 and 2021. Sentiment analysis based on natural language processing (NLP) techniques was conducted to quantify the polarity of media information for subsequent modeling. Additionally, to compare the accuracy of conventional time series forecasting models, such as ARIMA and its GARCH variants, deep learning models from the recurrent neural network family, specifically long short-term memory (LSTM) networks, were implemented. In particular, the impact of incorporating sentiment polarity as an additional variable in the LSTM and ARIMA model was evaluated to determine its influence on the accuracy of index predictions. This research aims to identify which model offers the highest prediction accuracy, providing an innovative approach at the intersection of sentiment analysis, econometrics, and artificial intelligence.PregradoProfesionalResumen.....8 Abstract.....9 Introducción.....10 Objetivos.....12 Objetivo general.....12 Objetivos específicos.....12 Planteamiento del problema.....13 Justificación.....15 Marco teórico.....17 Marco conceptual.....20 Planteamiento metodológico 23 Fase 1: Recolección de los datos.....23 Fase 2: Análisis de sentimientos (NLP).....24 Fase 3: Procesamiento y estructuración de los datos.....24 Fase 4: Modelamiento predictivo.....25 Fase 5: Evaluación de desempeño.....25 F1. Análisis exploratorio de la serie del S&P500.....26 F2 & F1. Análisis de sentimientos y análisis exploratorio.....30 F4. Modelamiento ARIMA clásico.....35 F4. Modelamiento red LSTM.....41 F4. Modelamiento ARIMA-X.....45 F4. Modelamiento LSTM con sentimiento (multivariado-multistep).....48 F5. Fase de evaluación.....51 Conclusiones.....52 Recomendaciones.....53 Referencias bibliográficas.....55 Anexos.....5861 páginasapplication/pdfOchoa, B. (2025). Análisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021) [Trabajo de grado, Universidad de Ibagué]. https://hdl.handle.net/20.500.12313/5259https://hdl.handle.net/20.500.12313/5259spaUniversidad de IbaguéCiencias Económicas y AdministrativasEspinalEconomíaAkerlof, G. & Shiller, R. (2010). Espíritus animales: Cómo la psicología humana impulsa la economía y por qué importa para el capitalismo global. Taurus.AWS. (2023). ¿Qué son las redes neuronales recurrentes? (RNN). Amazon Web ServicesAWS. (s.f.). ¿Qué es el Procesamiento de lenguaje natural (NLP)? Amazon Web ServicesChicago Booth. (s.f.). Richard H. Thaler – Behavioral Science and Economics Nobel Laureate. The University of Chicago Booth School of BusinessFuentes, C. (2010). Psicología y comportamiento de los inversionistas: Teoría de los espíritus animales de Keynes, Akerlof y Shiller. Universidad de Chile.Federal Reserve Bank. (2025). Federal Funds Effective Rate (FEDFUNDS).Gaitán, J. (2020). Fundamentos de finanzas corporativas. Ediciones de la U.Gonzalez, M. (2009). Análisis de series de tiempo: Modelos ARIMAHochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural ComputationHawkins, D. (2003). The problem of overfitting. School of Statistics, MinnesotaIBM. (2024). ¿Qué es el procesamiento de lenguaje natural? IBM Cloud Learn HudIBM. (2024). ¿Qué es el análisis de sentimiento? IBM Cloud Learn HudIBM. (2024). ¿Qué es el deep learning? IBM Cloud Learn HudIlomäki, J., & Laurila, J. (2018). Animal spirits in forecasting behavior: An experimental study. Journal of Behavioral and Experimental Economics, 75, 1–8.Keynes, J. (1936). Teoría General de la ocupación, el interés y el dinero. Fondo de cultura económica.Murphy, J. (1999). Análisis técnico de los mercados financieros: Una guía completa de los métodos y aplicaciones de inversión. Gestión 2000.Noble, J. (s.f.). ¿Qué son los modelos ARIMA? IBM Cloud Learn Hud.Shiller, R. (2000). Exuberancia irracional. Princeton University PressStatistics Easily, (s.f.). Glosario de estadística, análisis de datos y ciencia de datos.Tetlock. P. (2007). Giving content to investor sentiment: The role od media in the stock market. The Journal of Finance, 62(3).Pablo García et al. (2021). Avaneces en informática y automática. Decimoquinto Workshop. Departamento de Informática y Automáticainfo:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0)https://creativecommons.org/licenses/by-nc/4.0/Mercado busátilDeep LearningDeep Learning - S&P 500 (2019-2021)Mercado busátil - S&P 500 (2019-2021)Análisis de sentimientosS&P500Procesamiento de lenguaje naturalInteligencia artificialDeep learningPredicción del mercado bursátilSentiment analysisNatural Language ProcessingStock market predictionArtificial intelligenceAnálisis de sentimientos del mercado bursátil: Deep Learning y la influencia de los medios de comunicación en el índice S&P 500 (2019-2021)Trabajo de grado - Pregradohttp://purl.org/coar/resource_type/c_7a1fTextinfo:eu-repo/semantics/bachelorThesishttp://purl.org/redcol/resource_type/TPinfo:eu-repo/semantics/acceptedVersionPublicationORIGINALTrabajo de grado.pdfTrabajo de grado.pdfapplication/pdf1590743https://repositorio.unibague.edu.co/bitstreams/de9dfee5-5246-4ce9-a661-67bd7669561a/download99b0d99bdce778467acaa682302531ddMD52Formato de autorización .pdfFormato de autorización .pdfapplication/pdf182452https://repositorio.unibague.edu.co/bitstreams/4e141a72-7059-4f66-9692-4402f618b92e/download257be9f9daab12edc36ad0a82f4272d6MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8134https://repositorio.unibague.edu.co/bitstreams/4d568b6c-837a-443f-a996-e3c60d3e5e76/download2fa3e590786b9c0f3ceba1b9656b7ac3MD53TEXTTrabajo de grado.pdf.txtTrabajo de grado.pdf.txtExtracted texttext/plain74411https://repositorio.unibague.edu.co/bitstreams/f8a94746-c8c9-4ab7-ba8d-c22f984ebfd6/download3119f94c1f60235a99b27a43c47f55beMD58Formato de autorización .pdf.txtFormato de autorización .pdf.txtExtracted texttext/plain3901https://repositorio.unibague.edu.co/bitstreams/f41d0a26-b19f-469d-bf85-4f140f6af888/download3d6585dec9fd79c025ac3cac1840e1e9MD510THUMBNAILTrabajo de grado.pdf.jpgTrabajo de grado.pdf.jpgIM Thumbnailimage/jpeg4685https://repositorio.unibague.edu.co/bitstreams/db3c3cc2-c782-451f-90cc-bde83092777b/download8506fe84789bacf0c08da4b72588833cMD59Formato de autorización .pdf.jpgFormato de autorización .pdf.jpgIM Thumbnailimage/jpeg23012https://repositorio.unibague.edu.co/bitstreams/0a81f983-b9a5-4a24-bbee-cbb2c1ab098e/downloadced3b647bff126dd9ad2f0c4ea5a2b7dMD51120.500.12313/5259oai:repositorio.unibague.edu.co:20.500.12313/52592025-08-12 23:02:47.0https://creativecommons.org/licenses/by-nc/4.0/https://repositorio.unibague.edu.coRepositorio Institucional Universidad de Ibaguébdigital@metabiblioteca.comQ3JlYXRpdmUgQ29tbW9ucyBBdHRyaWJ1dGlvbi1Ob25Db21tZXJjaWFsLU5vRGVyaXZhdGl2ZXMgNC4wIEludGVybmF0aW9uYWwgTGljZW5zZQ0KaHR0cHM6Ly9jcmVhdGl2ZWNvbW1vbnMub3JnL2xpY2Vuc2VzL2J5LW5jLW5kLzQuMC8=