Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets

RESUMEN : El presente trabajo tiene como finalidad poder realizar un análisis de sentimientos en tweets en español. En una primera instancia se ha de tener en cuenta un tratamiento de los datos que involucran una normalización del lenguaje donde se eliminaran palabras vac´ıas (stopwords), emojis, me...

Full description

Autores:
Aguiar Valencia, Daniela
Tipo de recurso:
Tesis
Fecha de publicación:
2023
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/35518
Acceso en línea:
https://hdl.handle.net/10495/35518
Palabra clave:
Análisis de sentimientos
Sentiment Analysis
Minería de datos
Data Mining
Análisis de regresión logística
Tweets
Embedding
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
id UDEA2_daa27ec140e9fab137e87b42d83fd411
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/35518
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
title Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
spellingShingle Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
Análisis de sentimientos
Sentiment Analysis
Minería de datos
Data Mining
Análisis de regresión logística
Tweets
Embedding
title_short Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
title_full Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
title_fullStr Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
title_full_unstemmed Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
title_sort Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
dc.creator.fl_str_mv Aguiar Valencia, Daniela
dc.contributor.advisor.none.fl_str_mv Botia Valderrama, Javier Fernando
dc.contributor.author.none.fl_str_mv Aguiar Valencia, Daniela
dc.subject.decs.none.fl_str_mv Análisis de sentimientos
Sentiment Analysis
Minería de datos
Data Mining
topic Análisis de sentimientos
Sentiment Analysis
Minería de datos
Data Mining
Análisis de regresión logística
Tweets
Embedding
dc.subject.lemb.none.fl_str_mv Análisis de regresión logística
dc.subject.proposal.spa.fl_str_mv Tweets
Embedding
description RESUMEN : El presente trabajo tiene como finalidad poder realizar un análisis de sentimientos en tweets en español. En una primera instancia se ha de tener en cuenta un tratamiento de los datos que involucran una normalización del lenguaje donde se eliminaran palabras vac´ıas (stopwords), emojis, menciones entre otros. Después de estos se evaluaran diferentes métricas de desempe˜no de clasificación en cada uno de los modelos planteados, teniendo en cuenta diferentes formas de vectorización de los conjuntos de datos y tambi´en diferentes distribuciones de los mismos, esto con el fin de comparar primero la eficacia de cada modelo y adem´as si influye o no la porci´on de datos que se utilice para entrenar y testear y adem´as la forma de representar los mismos. Los mejores modelos que se encontraron fueron una regresión logística con una representaci´on de los datos dada por un embebimiento y un clasificador de stacking con una representaci´on de los datos dada por una vectorización Count Vectorizer.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-06-15T15:33:56Z
dc.date.available.none.fl_str_mv 2023-06-15T15:33:56Z
dc.date.issued.none.fl_str_mv 2023
dc.type.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Especialización
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_46ec
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/COther
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/other
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_46ec
status_str draft
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/10495/35518
url https://hdl.handle.net/10495/35518
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
https://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 35
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de Antioquia
dc.publisher.place.spa.fl_str_mv Medellín, Colombia
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/106dbae8-3a54-4838-8233-2824b7192e15/download
https://bibliotecadigital.udea.edu.co/bitstreams/1ae17bde-8a6c-4510-8d3e-6dcf9facea4e/download
https://bibliotecadigital.udea.edu.co/bitstreams/d1b994c4-fd2a-433a-a502-801ae1d1ce1e/download
https://bibliotecadigital.udea.edu.co/bitstreams/94a28280-fe0c-4189-b282-ef14880c21d8/download
https://bibliotecadigital.udea.edu.co/bitstreams/460226d8-1bf0-478c-84d1-87613efe0139/download
bitstream.checksum.fl_str_mv 5c8b464a59ff1249a13c137c8cf2392d
e2060682c9c70d4d30c83c51448f4eed
8a4605be74aa9ea9d79846c1fba20a33
6a3b2a4de01b023c9b78075fe4a1ce03
99013f3be17b81b7384e1722d97c07b0
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052411884404736
spelling Botia Valderrama, Javier FernandoAguiar Valencia, Daniela2023-06-15T15:33:56Z2023-06-15T15:33:56Z2023https://hdl.handle.net/10495/35518RESUMEN : El presente trabajo tiene como finalidad poder realizar un análisis de sentimientos en tweets en español. En una primera instancia se ha de tener en cuenta un tratamiento de los datos que involucran una normalización del lenguaje donde se eliminaran palabras vac´ıas (stopwords), emojis, menciones entre otros. Después de estos se evaluaran diferentes métricas de desempe˜no de clasificación en cada uno de los modelos planteados, teniendo en cuenta diferentes formas de vectorización de los conjuntos de datos y tambi´en diferentes distribuciones de los mismos, esto con el fin de comparar primero la eficacia de cada modelo y adem´as si influye o no la porci´on de datos que se utilice para entrenar y testear y adem´as la forma de representar los mismos. Los mejores modelos que se encontraron fueron una regresión logística con una representaci´on de los datos dada por un embebimiento y un clasificador de stacking con una representaci´on de los datos dada por una vectorización Count Vectorizer.ABSTRACT : The purpose of this paper is to perform an analysis of sentiments in tweets in Spanish. In the first instance, a treatment of the data that involves a normalization of the language must be taken into account where stopword, emojis, mentions, among others, will be eliminated. After these, different classification performance metrics will be evaluated in each of the proposed models, taking into account different forms of vectorization of the data sets and also different distributions of the same, this in order to first compare the effectiveness of each model and also if it influences or not the portion of data that is used to train and test and also the way of representing them. The best models found were a logistic regression with a representation of the data given by an embedding and a stacking classifier with a representation of the data given by a Count Vectorizer.EspecializaciónEspecialista en Analítica y Ciencia de Datos35application/pdfspaUniversidad de AntioquiaMedellín, ColombiaFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datoshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweetsTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftAnálisis de sentimientosSentiment AnalysisMinería de datosData MiningAnálisis de regresión logísticaTweetsEmbeddingPublicationORIGINALAguiarDaniela_2023_AnalisisSentimientosTweets.pdfAguiarDaniela_2023_AnalisisSentimientosTweets.pdfTrabajo de grado de especializaciónapplication/pdf2365832https://bibliotecadigital.udea.edu.co/bitstreams/106dbae8-3a54-4838-8233-2824b7192e15/download5c8b464a59ff1249a13c137c8cf2392dMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/1ae17bde-8a6c-4510-8d3e-6dcf9facea4e/downloade2060682c9c70d4d30c83c51448f4eedMD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/d1b994c4-fd2a-433a-a502-801ae1d1ce1e/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTEXTAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.txtAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.txtExtracted texttext/plain44755https://bibliotecadigital.udea.edu.co/bitstreams/94a28280-fe0c-4189-b282-ef14880c21d8/download6a3b2a4de01b023c9b78075fe4a1ce03MD55falseAnonymousREADTHUMBNAILAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.jpgAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.jpgGenerated Thumbnailimage/jpeg6128https://bibliotecadigital.udea.edu.co/bitstreams/460226d8-1bf0-478c-84d1-87613efe0139/download99013f3be17b81b7384e1722d97c07b0MD56falseAnonymousREAD10495/35518oai:bibliotecadigital.udea.edu.co:10495/355182025-03-26 21:56:15.847http://creativecommons.org/licenses/by-nc-sa/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=