Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages
RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su proc...
- Autores:
-
Pemberty Tamayo, José Luis
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2020
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/16570
- Acceso en línea:
- http://hdl.handle.net/10495/16570
- Palabra clave:
- Lingüística computacional
Computational linguistics
Etiquetado
Lingüística de corpus
Linguistica - Procesamiento de datos
Lingüística aplicada
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-nd/2.5/co/
| id |
UDEA2_172e8e75f6e0ea87c1897c2c212af4aa |
|---|---|
| oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/16570 |
| network_acronym_str |
UDEA2 |
| network_name_str |
Repositorio UdeA |
| repository_id_str |
|
| dc.title.spa.fl_str_mv |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
| dc.title.translated.spa.fl_str_mv |
Conception and development of a semi-automatic tagging system for under-resourced languages |
| title |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
| spellingShingle |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages Lingüística computacional Computational linguistics Etiquetado Lingüística de corpus Linguistica - Procesamiento de datos Lingüística aplicada |
| title_short |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
| title_full |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
| title_fullStr |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
| title_full_unstemmed |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
| title_sort |
Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languages |
| dc.creator.fl_str_mv |
Pemberty Tamayo, José Luis |
| dc.contributor.advisor.none.fl_str_mv |
Molina Mejía, Jorge Mauricio |
| dc.contributor.author.none.fl_str_mv |
Pemberty Tamayo, José Luis |
| dc.contributor.researchgroup.spa.fl_str_mv |
Grupo de Estudios Sociolingüísticos |
| dc.subject.lemb.none.fl_str_mv |
Lingüística computacional Computational linguistics |
| topic |
Lingüística computacional Computational linguistics Etiquetado Lingüística de corpus Linguistica - Procesamiento de datos Lingüística aplicada |
| dc.subject.proposal.spa.fl_str_mv |
Etiquetado Lingüística de corpus Linguistica - Procesamiento de datos Lingüística aplicada |
| description |
RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su procesamiento automático en muchos casos. En este sentido, se propone y se describe un algoritmo que busca asistir el etiquetado manual a nivel de POS de corpus textuales en lenguas para las que aún no existe el etiquetado automático. Así mismo, se presenta un ejemplo de aplicación de este algoritmo a través de un sencillo programa que puede ser probado por el lector. |
| publishDate |
2020 |
| dc.date.accessioned.none.fl_str_mv |
2020-09-03T14:14:26Z |
| dc.date.available.none.fl_str_mv |
2020-09-03T14:14:26Z |
| dc.date.issued.none.fl_str_mv |
2020 |
| dc.type.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Pregrado |
| dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
| dc.type.redcol.spa.fl_str_mv |
https://purl.org/redcol/resource_type/TP |
| dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
| dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/draft |
| format |
http://purl.org/coar/resource_type/c_7a1f |
| status_str |
draft |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10495/16570 |
| url |
http://hdl.handle.net/10495/16570 |
| dc.language.iso.spa.fl_str_mv |
spa |
| language |
spa |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ |
| dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.rights.accessrights.*.fl_str_mv |
Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) |
| dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/co/ https://creativecommons.org/licenses/by-nc-nd/4.0/ Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) http://purl.org/coar/access_right/c_abf2 |
| eu_rights_str_mv |
openAccess |
| dc.format.extent.spa.fl_str_mv |
59 |
| dc.format.mimetype.spa.fl_str_mv |
application/pdf |
| dc.publisher.spa.fl_str_mv |
Universidad de Antioquia |
| dc.publisher.place.spa.fl_str_mv |
Medellín, Colombia |
| dc.publisher.faculty.spa.fl_str_mv |
Facultad de Comunicaciones y Filología. Carrera de Filología Hispánica |
| institution |
Universidad de Antioquia |
| bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstreams/f14c49eb-5bd7-4d4b-80d4-08e6a82cb9dd/download https://bibliotecadigital.udea.edu.co/bitstreams/e107b4bc-3ddd-4502-92b6-c8d811b8475a/download https://bibliotecadigital.udea.edu.co/bitstreams/30087cfa-c1ce-4502-8e6a-e0054a1fb829/download https://bibliotecadigital.udea.edu.co/bitstreams/080ee712-cbeb-4a47-b642-39141e9429b6/download https://bibliotecadigital.udea.edu.co/bitstreams/9faab67b-5f9b-4d9e-9ab8-3b5877a5095c/download https://bibliotecadigital.udea.edu.co/bitstreams/fe5a2b30-7447-4400-822c-6a6bc3d5410c/download https://bibliotecadigital.udea.edu.co/bitstreams/e6bb0296-1ef8-4dfc-a307-e41484c27db0/download https://bibliotecadigital.udea.edu.co/bitstreams/aa985504-e27d-4f92-94cf-580b4ca6058f/download https://bibliotecadigital.udea.edu.co/bitstreams/47f7e6f9-7cdb-480b-815a-7b1f7b0cb532/download https://bibliotecadigital.udea.edu.co/bitstreams/fcfa2017-0697-4d1a-baf6-90d32fd43a58/download |
| bitstream.checksum.fl_str_mv |
20d27a9e9950d665ca82e22f6438ae16 25a3dbe727194b1a45a9385bef19946b e253710087041711ce7b908bf5ce36fb c2868204d1fc9ddbb46e55d10474d802 b88b088d9957e670ce3b3fbe2eedbc13 8a4605be74aa9ea9d79846c1fba20a33 69b136844d678e03be24600b7052e34d b4d4139c1f3f8af602d63d2995f46b25 f4bd85be77a43b5eca087ea29dfb4bf4 c59e60faf1273bd456b9d4f83ab1e374 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad de Antioquia |
| repository.mail.fl_str_mv |
aplicacionbibliotecadigitalbiblioteca@udea.edu.co |
| _version_ |
1851052318003298304 |
| spelling |
Molina Mejía, Jorge MauricioPemberty Tamayo, José LuisGrupo de Estudios Sociolingüísticos2020-09-03T14:14:26Z2020-09-03T14:14:26Z2020http://hdl.handle.net/10495/16570RESUMEN: Este trabajo parte del hecho de que la lingüística de corpus y la lingüística computacional están cobrando importancia en la comprensión y el estudio de las lenguas, y que la gran diversidad lingüística de nuestro país y del mundo hace que sea difícil la tarea de crear recursos para su procesamiento automático en muchos casos. En este sentido, se propone y se describe un algoritmo que busca asistir el etiquetado manual a nivel de POS de corpus textuales en lenguas para las que aún no existe el etiquetado automático. Así mismo, se presenta un ejemplo de aplicación de este algoritmo a través de un sencillo programa que puede ser probado por el lector.ABSTRACT: This work is based in the fact that corpus linguistics and computational linguistics are gaining importance in the understanding and study of languages and that the great linguistic diversity of our country and the world makes it difficult to create resources for their automatic processing in many cases. In this sense, an algorithm that seeks to assist manual tagging at the POS level of textual corpora in languages for which automatic tagging does not yet exist is proposed and described. Also, an example of application of this algorithm is presented through a simple program that can be tested by the reader.PregradoFilólogo Hispanista59application/pdfspaUniversidad de AntioquiaMedellín, ColombiaFacultad de Comunicaciones y Filología. Carrera de Filología Hispánicahttp://creativecommons.org/licenses/by-nc-nd/2.5/co/https://creativecommons.org/licenses/by-nc-nd/4.0/Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Concepción y elaboración de un sistema de etiquetado semiautomático para under-resourced languagesConception and development of a semi-automatic tagging system for under-resourced languagesTesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttps://purl.org/redcol/resource_type/TPhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/draftLingüística computacionalComputational linguisticsEtiquetadoLingüística de corpusLinguistica - Procesamiento de datosLingüística aplicadaPublicationORIGINALPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdfPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdfTrabajo de grado de pregradoapplication/pdf1533658https://bibliotecadigital.udea.edu.co/bitstreams/f14c49eb-5bd7-4d4b-80d4-08e6a82cb9dd/download20d27a9e9950d665ca82e22f6438ae16MD52trueAnonymousREADActaSustentación.pdfActaSustentación.pdfapplication/pdf157364https://bibliotecadigital.udea.edu.co/bitstreams/e107b4bc-3ddd-4502-92b6-c8d811b8475a/download25a3dbe727194b1a45a9385bef19946bMD53falseAdministratorREADUnderRL_Tagger_exe.zipUnderRL_Tagger_exe.zipAnexoapplication/zip406315388https://bibliotecadigital.udea.edu.co/bitstreams/30087cfa-c1ce-4502-8e6a-e0054a1fb829/downloade253710087041711ce7b908bf5ce36fbMD55falseAdministratorREADUnderRL_Tagger_py.zipUnderRL_Tagger_py.zipAnexoapplication/zip17880https://bibliotecadigital.udea.edu.co/bitstreams/080ee712-cbeb-4a47-b642-39141e9429b6/downloadc2868204d1fc9ddbb46e55d10474d802MD56falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8823https://bibliotecadigital.udea.edu.co/bitstreams/9faab67b-5f9b-4d9e-9ab8-3b5877a5095c/downloadb88b088d9957e670ce3b3fbe2eedbc13MD57falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/fe5a2b30-7447-4400-822c-6a6bc3d5410c/download8a4605be74aa9ea9d79846c1fba20a33MD58falseAnonymousREADTEXTPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.txtPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.txtExtracted texttext/plain101566https://bibliotecadigital.udea.edu.co/bitstreams/e6bb0296-1ef8-4dfc-a307-e41484c27db0/download69b136844d678e03be24600b7052e34dMD59falseAnonymousREADActaSustentación.pdf.txtActaSustentación.pdf.txtExtracted texttext/plain1922https://bibliotecadigital.udea.edu.co/bitstreams/aa985504-e27d-4f92-94cf-580b4ca6058f/downloadb4d4139c1f3f8af602d63d2995f46b25MD511falseAdministratorREADTHUMBNAILPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.jpgPembertyJose_2020_EtiquetadoSemiautomáticoUnder-resourced.pdf.jpgGenerated Thumbnailimage/jpeg10878https://bibliotecadigital.udea.edu.co/bitstreams/47f7e6f9-7cdb-480b-815a-7b1f7b0cb532/downloadf4bd85be77a43b5eca087ea29dfb4bf4MD510falseAnonymousREADActaSustentación.pdf.jpgActaSustentación.pdf.jpgGenerated Thumbnailimage/jpeg11805https://bibliotecadigital.udea.edu.co/bitstreams/fcfa2017-0697-4d1a-baf6-90d32fd43a58/downloadc59e60faf1273bd456b9d4f83ab1e374MD512falseAdministratorREAD10495/16570oai:bibliotecadigital.udea.edu.co:10495/165702025-03-26 20:26:46.318http://creativecommons.org/licenses/by-nc-nd/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
