Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets
RESUMEN : El presente trabajo tiene como finalidad poder realizar un análisis de sentimientos en tweets en español. En una primera instancia se ha de tener en cuenta un tratamiento de los datos que involucran una normalización del lenguaje donde se eliminaran palabras vac´ıas (stopwords), emojis, me...
- Autores:
-
Aguiar Valencia, Daniela
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2023
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/35518
- Acceso en línea:
- https://hdl.handle.net/10495/35518
- Palabra clave:
- Análisis de sentimientos
Sentiment Analysis
Minería de datos
Data Mining
Análisis de regresión logística
Tweets
Embedding
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/2.5/co/
| id |
UDEA2_daa27ec140e9fab137e87b42d83fd411 |
|---|---|
| oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/35518 |
| network_acronym_str |
UDEA2 |
| network_name_str |
Repositorio UdeA |
| repository_id_str |
|
| dc.title.spa.fl_str_mv |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets |
| title |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets |
| spellingShingle |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets Análisis de sentimientos Sentiment Analysis Minería de datos Data Mining Análisis de regresión logística Tweets Embedding |
| title_short |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets |
| title_full |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets |
| title_fullStr |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets |
| title_full_unstemmed |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets |
| title_sort |
Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweets |
| dc.creator.fl_str_mv |
Aguiar Valencia, Daniela |
| dc.contributor.advisor.none.fl_str_mv |
Botia Valderrama, Javier Fernando |
| dc.contributor.author.none.fl_str_mv |
Aguiar Valencia, Daniela |
| dc.subject.decs.none.fl_str_mv |
Análisis de sentimientos Sentiment Analysis Minería de datos Data Mining |
| topic |
Análisis de sentimientos Sentiment Analysis Minería de datos Data Mining Análisis de regresión logística Tweets Embedding |
| dc.subject.lemb.none.fl_str_mv |
Análisis de regresión logística |
| dc.subject.proposal.spa.fl_str_mv |
Tweets Embedding |
| description |
RESUMEN : El presente trabajo tiene como finalidad poder realizar un análisis de sentimientos en tweets en español. En una primera instancia se ha de tener en cuenta un tratamiento de los datos que involucran una normalización del lenguaje donde se eliminaran palabras vac´ıas (stopwords), emojis, menciones entre otros. Después de estos se evaluaran diferentes métricas de desempe˜no de clasificación en cada uno de los modelos planteados, teniendo en cuenta diferentes formas de vectorización de los conjuntos de datos y tambi´en diferentes distribuciones de los mismos, esto con el fin de comparar primero la eficacia de cada modelo y adem´as si influye o no la porci´on de datos que se utilice para entrenar y testear y adem´as la forma de representar los mismos. Los mejores modelos que se encontraron fueron una regresión logística con una representaci´on de los datos dada por un embebimiento y un clasificador de stacking con una representaci´on de los datos dada por una vectorización Count Vectorizer. |
| publishDate |
2023 |
| dc.date.accessioned.none.fl_str_mv |
2023-06-15T15:33:56Z |
| dc.date.available.none.fl_str_mv |
2023-06-15T15:33:56Z |
| dc.date.issued.none.fl_str_mv |
2023 |
| dc.type.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Especialización |
| dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_46ec |
| dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/COther |
| dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
| dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/other |
| dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/draft |
| format |
http://purl.org/coar/resource_type/c_46ec |
| status_str |
draft |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/10495/35518 |
| url |
https://hdl.handle.net/10495/35518 |
| dc.language.iso.spa.fl_str_mv |
spa |
| language |
spa |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ |
| dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ https://creativecommons.org/licenses/by-nc-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
| eu_rights_str_mv |
openAccess |
| dc.format.extent.spa.fl_str_mv |
35 |
| dc.format.mimetype.spa.fl_str_mv |
application/pdf |
| dc.publisher.spa.fl_str_mv |
Universidad de Antioquia |
| dc.publisher.place.spa.fl_str_mv |
Medellín, Colombia |
| dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos |
| institution |
Universidad de Antioquia |
| bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstreams/106dbae8-3a54-4838-8233-2824b7192e15/download https://bibliotecadigital.udea.edu.co/bitstreams/1ae17bde-8a6c-4510-8d3e-6dcf9facea4e/download https://bibliotecadigital.udea.edu.co/bitstreams/d1b994c4-fd2a-433a-a502-801ae1d1ce1e/download https://bibliotecadigital.udea.edu.co/bitstreams/94a28280-fe0c-4189-b282-ef14880c21d8/download https://bibliotecadigital.udea.edu.co/bitstreams/460226d8-1bf0-478c-84d1-87613efe0139/download |
| bitstream.checksum.fl_str_mv |
5c8b464a59ff1249a13c137c8cf2392d e2060682c9c70d4d30c83c51448f4eed 8a4605be74aa9ea9d79846c1fba20a33 6a3b2a4de01b023c9b78075fe4a1ce03 99013f3be17b81b7384e1722d97c07b0 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad de Antioquia |
| repository.mail.fl_str_mv |
aplicacionbibliotecadigitalbiblioteca@udea.edu.co |
| _version_ |
1851052411884404736 |
| spelling |
Botia Valderrama, Javier FernandoAguiar Valencia, Daniela2023-06-15T15:33:56Z2023-06-15T15:33:56Z2023https://hdl.handle.net/10495/35518RESUMEN : El presente trabajo tiene como finalidad poder realizar un análisis de sentimientos en tweets en español. En una primera instancia se ha de tener en cuenta un tratamiento de los datos que involucran una normalización del lenguaje donde se eliminaran palabras vac´ıas (stopwords), emojis, menciones entre otros. Después de estos se evaluaran diferentes métricas de desempe˜no de clasificación en cada uno de los modelos planteados, teniendo en cuenta diferentes formas de vectorización de los conjuntos de datos y tambi´en diferentes distribuciones de los mismos, esto con el fin de comparar primero la eficacia de cada modelo y adem´as si influye o no la porci´on de datos que se utilice para entrenar y testear y adem´as la forma de representar los mismos. Los mejores modelos que se encontraron fueron una regresión logística con una representaci´on de los datos dada por un embebimiento y un clasificador de stacking con una representaci´on de los datos dada por una vectorización Count Vectorizer.ABSTRACT : The purpose of this paper is to perform an analysis of sentiments in tweets in Spanish. In the first instance, a treatment of the data that involves a normalization of the language must be taken into account where stopword, emojis, mentions, among others, will be eliminated. After these, different classification performance metrics will be evaluated in each of the proposed models, taking into account different forms of vectorization of the data sets and also different distributions of the same, this in order to first compare the effectiveness of each model and also if it influences or not the portion of data that is used to train and test and also the way of representing them. The best models found were a logistic regression with a representation of the data given by an embedding and a stacking classifier with a representation of the data given by a Count Vectorizer.EspecializaciónEspecialista en Analítica y Ciencia de Datos35application/pdfspaUniversidad de AntioquiaMedellín, ColombiaFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datoshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Uso de arquitecturas de inteligencia artificial para la determinación y análisis de sentimientos en tweetsTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftAnálisis de sentimientosSentiment AnalysisMinería de datosData MiningAnálisis de regresión logísticaTweetsEmbeddingPublicationORIGINALAguiarDaniela_2023_AnalisisSentimientosTweets.pdfAguiarDaniela_2023_AnalisisSentimientosTweets.pdfTrabajo de grado de especializaciónapplication/pdf2365832https://bibliotecadigital.udea.edu.co/bitstreams/106dbae8-3a54-4838-8233-2824b7192e15/download5c8b464a59ff1249a13c137c8cf2392dMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/1ae17bde-8a6c-4510-8d3e-6dcf9facea4e/downloade2060682c9c70d4d30c83c51448f4eedMD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/d1b994c4-fd2a-433a-a502-801ae1d1ce1e/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTEXTAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.txtAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.txtExtracted texttext/plain44755https://bibliotecadigital.udea.edu.co/bitstreams/94a28280-fe0c-4189-b282-ef14880c21d8/download6a3b2a4de01b023c9b78075fe4a1ce03MD55falseAnonymousREADTHUMBNAILAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.jpgAguiarDaniela_2023_AnalisisSentimientosTweets.pdf.jpgGenerated Thumbnailimage/jpeg6128https://bibliotecadigital.udea.edu.co/bitstreams/460226d8-1bf0-478c-84d1-87613efe0139/download99013f3be17b81b7384e1722d97c07b0MD56falseAnonymousREAD10495/35518oai:bibliotecadigital.udea.edu.co:10495/355182025-03-26 21:56:15.847http://creativecommons.org/licenses/by-nc-sa/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
