Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages

RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su proc...

Full description

Autores:
Pemberty Tamayo, José Luis
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2020
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/16570
Acceso en línea:
http://hdl.handle.net/10495/16570
Palabra clave:
Lingüística computacional
Computational linguistics
Etiquetado
Lingüística de corpus
Linguistica - Procesamiento de datos
Lingüística aplicada
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
id UDEA2_172e8e75f6e0ea87c1897c2c212af4aa
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/16570
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
dc.title.translated.spa.fl_str_mv Conception and development of a semi-automatic tagging system for under-resourced languages
title Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
spellingShingle Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
Lingüística computacional
Computational linguistics
Etiquetado
Lingüística de corpus
Linguistica - Procesamiento de datos
Lingüística aplicada
title_short Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
title_full Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
title_fullStr Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
title_full_unstemmed Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
title_sort Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
dc.creator.fl_str_mv Pemberty Tamayo, José Luis
dc.contributor.advisor.none.fl_str_mv Molina Mejía, Jorge Mauricio
dc.contributor.author.none.fl_str_mv Pemberty Tamayo, José Luis
dc.contributor.researchgroup.spa.fl_str_mv Grupo de Estudios Sociolingüísticos
dc.subject.lemb.none.fl_str_mv Lingüística computacional
Computational linguistics
topic Lingüística computacional
Computational linguistics
Etiquetado
Lingüística de corpus
Linguistica - Procesamiento de datos
Lingüística aplicada
dc.subject.proposal.spa.fl_str_mv Etiquetado
Lingüística de corpus
Linguistica - Procesamiento de datos
Lingüística aplicada
description RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su procesamiento automático en muchos casos. En este sentido, se propone y se describe un algoritmo que busca asistir el etiquetado manual a nivel de POS de corpus textuales en lenguas para las que aún no existe el etiquetado automático. Así mismo, se presenta un ejemplo de aplicación de este algoritmo a través de un sencillo programa que puede ser probado por el lector.
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-09-03T14:14:26Z
dc.date.available.none.fl_str_mv 2020-09-03T14:14:26Z
dc.date.issued.none.fl_str_mv 2020
dc.type.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TP
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_7a1f
status_str draft
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/16570
url http://hdl.handle.net/10495/16570
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.accessrights.*.fl_str_mv Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
https://creativecommons.org/licenses/by-nc-nd/4.0/
Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 59
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de Antioquia
dc.publisher.place.spa.fl_str_mv Medellín, Colombia
dc.publisher.faculty.spa.fl_str_mv Facultad de Comunicaciones y Filología. Carrera de Filología Hispánica
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/f14c49eb-5bd7-4d4b-80d4-08e6a82cb9dd/download
https://bibliotecadigital.udea.edu.co/bitstreams/e107b4bc-3ddd-4502-92b6-c8d811b8475a/download
https://bibliotecadigital.udea.edu.co/bitstreams/30087cfa-c1ce-4502-8e6a-e0054a1fb829/download
https://bibliotecadigital.udea.edu.co/bitstreams/080ee712-cbeb-4a47-b642-39141e9429b6/download
https://bibliotecadigital.udea.edu.co/bitstreams/9faab67b-5f9b-4d9e-9ab8-3b5877a5095c/download
https://bibliotecadigital.udea.edu.co/bitstreams/fe5a2b30-7447-4400-822c-6a6bc3d5410c/download
https://bibliotecadigital.udea.edu.co/bitstreams/e6bb0296-1ef8-4dfc-a307-e41484c27db0/download
https://bibliotecadigital.udea.edu.co/bitstreams/aa985504-e27d-4f92-94cf-580b4ca6058f/download
https://bibliotecadigital.udea.edu.co/bitstreams/47f7e6f9-7cdb-480b-815a-7b1f7b0cb532/download
https://bibliotecadigital.udea.edu.co/bitstreams/fcfa2017-0697-4d1a-baf6-90d32fd43a58/download
bitstream.checksum.fl_str_mv 20d27a9e9950d665ca82e22f6438ae16
25a3dbe727194b1a45a9385bef19946b
e253710087041711ce7b908bf5ce36fb
c2868204d1fc9ddbb46e55d10474d802
b88b088d9957e670ce3b3fbe2eedbc13
8a4605be74aa9ea9d79846c1fba20a33
69b136844d678e03be24600b7052e34d
b4d4139c1f3f8af602d63d2995f46b25
f4bd85be77a43b5eca087ea29dfb4bf4
c59e60faf1273bd456b9d4f83ab1e374
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052318003298304
spelling Molina Mejía, Jorge MauricioPemberty Tamayo, José LuisGrupo de Estudios Sociolingüísticos2020-09-03T14:14:26Z2020-09-03T14:14:26Z2020http://hdl.handle.net/10495/16570RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su procesamiento automático en muchos casos. En este sentido, se propone y se describe un algoritmo que busca asistir el etiquetado manual a nivel de POS de corpus textuales en lenguas para las que aún no existe el etiquetado automático. Así mismo, se presenta un ejemplo de aplicación de este algoritmo a través de un sencillo programa que puede ser probado por el lector.ABSTRACT: This work is based in the fact that corpus linguistics and computational linguistics are gaining importance in the understanding and study of languages and that the great linguistic diversity of our country and the world makes it difficult to create resources for their automatic processing in many cases. In this sense, an algorithm that seeks to assist manual tagging at the POS level of textual corpora in languages for which automatic tagging does not yet exist is proposed and described. Also, an example of application of this algorithm is presented through a simple program that can be tested by the reader.PregradoFilólogo Hispanista59application/pdfspaUniversidad de AntioquiaMedellín, ColombiaFacultad de Comunicaciones y Filología. Carrera de Filología Hispánicahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/https://creativecommons.org/licenses/by-nc-nd/4.0/Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languagesConception and development of a semi-automatic tagging system for under-resourced languagesTesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttps://purl.org/redcol/resource_type/TPhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/draftLingüística computacionalComputational linguisticsEtiquetadoLingüística de corpusLinguistica - Procesamiento de datosLingüística aplicadaPublicationORIGINALPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdfPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdfTrabajo de grado de pregradoapplication/pdf1533658https://bibliotecadigital.udea.edu.co/bitstreams/f14c49eb-5bd7-4d4b-80d4-08e6a82cb9dd/download20d27a9e9950d665ca82e22f6438ae16MD52trueAnonymousREADActaSustentación.pdfActaSustentación.pdfapplication/pdf157364https://bibliotecadigital.udea.edu.co/bitstreams/e107b4bc-3ddd-4502-92b6-c8d811b8475a/download25a3dbe727194b1a45a9385bef19946bMD53falseAdministratorREADUnderRL_Tagger_exe.zipUnderRL_Tagger_exe.zipAnexoapplication/zip406315388https://bibliotecadigital.udea.edu.co/bitstreams/30087cfa-c1ce-4502-8e6a-e0054a1fb829/downloade253710087041711ce7b908bf5ce36fbMD55falseAdministratorREADUnderRL_Tagger_py.zipUnderRL_Tagger_py.zipAnexoapplication/zip17880https://bibliotecadigital.udea.edu.co/bitstreams/080ee712-cbeb-4a47-b642-39141e9429b6/downloadc2868204d1fc9ddbb46e55d10474d802MD56falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8823https://bibliotecadigital.udea.edu.co/bitstreams/9faab67b-5f9b-4d9e-9ab8-3b5877a5095c/downloadb88b088d9957e670ce3b3fbe2eedbc13MD57falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/fe5a2b30-7447-4400-822c-6a6bc3d5410c/download8a4605be74aa9ea9d79846c1fba20a33MD58falseAnonymousREADTEXTPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.txtPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.txtExtracted texttext/plain101566https://bibliotecadigital.udea.edu.co/bitstreams/e6bb0296-1ef8-4dfc-a307-e41484c27db0/download69b136844d678e03be24600b7052e34dMD59falseAnonymousREADActaSustentación.pdf.txtActaSustentación.pdf.txtExtracted texttext/plain1922https://bibliotecadigital.udea.edu.co/bitstreams/aa985504-e27d-4f92-94cf-580b4ca6058f/downloadb4d4139c1f3f8af602d63d2995f46b25MD511falseAdministratorREADTHUMBNAILPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.jpgPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.jpgGenerated Thumbnailimage/jpeg10878https://bibliotecadigital.udea.edu.co/bitstreams/47f7e6f9-7cdb-480b-815a-7b1f7b0cb532/downloadf4bd85be77a43b5eca087ea29dfb4bf4MD510falseAnonymousREADActaSustentación.pdf.jpgActaSustentación.pdf.jpgGenerated Thumbnailimage/jpeg11805https://bibliotecadigital.udea.edu.co/bitstreams/fcfa2017-0697-4d1a-baf6-90d32fd43a58/downloadc59e60faf1273bd456b9d4f83ab1e374MD512falseAdministratorREAD10495/16570oai:bibliotecadigital.udea.edu.co:10495/165702025-03-26 20:26:46.318http://creativecommons.org/licenses/by-nc-nd/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=