Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG
Trabajo de grado presentado como requisito para optar el título de (Ingeniero Informático). Facultad de Ingenierías. Politécnico Colombiano Jaime Isaza Cadavid, 2024.
- Autores:
-
Huguet Ospina, Juan José
- Tipo de recurso:
- Fecha de publicación:
- 2024
- Institución:
- Politécnico Colombiano Jaime Izasa Cadavid
- Repositorio:
- ICARUS
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.elpoli.edu.co:123456789/9027
- Acceso en línea:
- https://repositorio.elpoli.edu.co/handle/123456789/9027
- Palabra clave:
- Búsqueda electrónica de recursos de información
Investigación científica
Universidad Nacional de Colombia. Grupo de Automática
Generación aumentada recolectada
LangChain
Python
ChromaDB
- Rights
- License
- http://creativecommons.org/licenses/by-nc/4.0/
| id |
ICARUS2_af44270e17dd6880f911191c1f712614 |
|---|---|
| oai_identifier_str |
oai:repositorio.elpoli.edu.co:123456789/9027 |
| network_acronym_str |
ICARUS2 |
| network_name_str |
ICARUS |
| repository_id_str |
|
| dc.title.none.fl_str_mv |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
| title |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
| spellingShingle |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG Búsqueda electrónica de recursos de información Investigación científica Universidad Nacional de Colombia. Grupo de Automática Generación aumentada recolectada LangChain Python ChromaDB |
| title_short |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
| title_full |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
| title_fullStr |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
| title_full_unstemmed |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
| title_sort |
Desarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAG |
| dc.creator.fl_str_mv |
Huguet Ospina, Juan José |
| dc.contributor.advisor.none.fl_str_mv |
Espinosa Oviedo, Jorge Ernesto |
| dc.contributor.author.none.fl_str_mv |
Huguet Ospina, Juan José |
| dc.subject.none.fl_str_mv |
Búsqueda electrónica de recursos de información Investigación científica Universidad Nacional de Colombia. Grupo de Automática Generación aumentada recolectada LangChain Python ChromaDB |
| topic |
Búsqueda electrónica de recursos de información Investigación científica Universidad Nacional de Colombia. Grupo de Automática Generación aumentada recolectada LangChain Python ChromaDB |
| description |
Trabajo de grado presentado como requisito para optar el título de (Ingeniero Informático). Facultad de Ingenierías. Politécnico Colombiano Jaime Isaza Cadavid, 2024. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2025-04-25T19:26:40Z |
| dc.date.available.none.fl_str_mv |
2025-04-25T19:26:40Z |
| dc.date.none.fl_str_mv |
2024 |
| dc.type.none.fl_str_mv |
http://purl.org/redcol/resource_type/TP |
| dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_7a1f |
| dc.identifier.other.none.fl_str_mv |
TIIN1063 |
| dc.identifier.uri.none.fl_str_mv |
https://repositorio.elpoli.edu.co/handle/123456789/9027 |
| identifier_str_mv |
TIIN1063 |
| url |
https://repositorio.elpoli.edu.co/handle/123456789/9027 |
| dc.language.iso.fl_str_mv |
spa |
| language |
spa |
| dc.rights.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ |
| dc.rights.cc.none.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/4.0/ http://purl.org/coar/access_right/c_abf2 |
| dc.format.none.fl_str_mv |
http://purl.org/coar/resource_type/c_18cf |
| dc.publisher.none.fl_str_mv |
Rionegro: Politécnico Colombiano Jaime Isaza Cadavid |
| dc.publisher.department.none.fl_str_mv |
Facultad de Ingeniería |
| dc.publisher.program.none.fl_str_mv |
Ingeniería Informática |
| publisher.none.fl_str_mv |
Rionegro: Politécnico Colombiano Jaime Isaza Cadavid |
| institution |
Politécnico Colombiano Jaime Izasa Cadavid |
| bitstream.url.fl_str_mv |
https://repositorio.elpoli.edu.co/bitstreams/1804b29f-dec4-4951-a92f-5c6893bf4dc1/download https://repositorio.elpoli.edu.co/bitstreams/e2fcc53f-0067-441a-9888-058fc7e982ca/download https://repositorio.elpoli.edu.co/bitstreams/03826895-fa97-4a71-ae32-e0cc8aff960d/download |
| bitstream.checksum.fl_str_mv |
472812fcea495215bae6d804b759e7f4 11366b27195a895f0cb5d1c670b7b96c 642f93b35eb56513c4d14578dcf73516 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional POLIJIC |
| repository.mail.fl_str_mv |
repositorio.polijic@gmail.com |
| _version_ |
1849239214527348736 |
| spelling |
Espinosa Oviedo, Jorge ErnestoHuguet Ospina, Juan José20242025-04-25T19:26:40Z2025-04-25T19:26:40ZTrabajo de grado presentado como requisito para optar el título de (Ingeniero Informático). Facultad de Ingenierías. Politécnico Colombiano Jaime Isaza Cadavid, 2024.El trabajo de grado desarrolla un sistema web para el Grupo de Automática de la Universidad Nacional(GAUNAL) que permite responder a preguntas específicas y generales de un usuario mediante la utilización de documentos académicos mediante la integración de Modelos Grandes de Lenguaje (LLMs), bases de datos vectorizadas y la técnica Retrieval-Augmented Generation (RAG). Utilizando herramientas como LangChain, Python, y ChromaDB, se implementa una solución modular y contenerizada, capaz de procesar grandes volúmenes de datos y contextualizar respuestas según las consultas de los usuarios. Se destaca la realización de pruebas unitarias y la optimización de recursos para garantizar un funcionamiento eficiente en un entorno on-premise.http://purl.org/coar/resource_type/c_18cfTIIN1063https://repositorio.elpoli.edu.co/handle/123456789/9027Rionegro: Politécnico Colombiano Jaime Isaza CadavidFacultad de IngenieríaIngeniería Informáticahttp://creativecommons.org/licenses/by-nc/4.0/http://purl.org/coar/access_right/c_abf2Búsqueda electrónica de recursos de informaciónInvestigación científicaUniversidad Nacional de Colombia. Grupo de AutomáticaGeneración aumentada recolectadaLangChainPythonChromaDBDesarrollo de un sistema de clasificación y búsqueda de artículos académicos mediante cadenas con modelos de lenguaje y contextualización por modelos RAGhttp://purl.org/redcol/resource_type/TPhttp://purl.org/coar/resource_type/c_7a1fspaORIGINALTIIN1063.pdfTIIN1063.pdfapplication/pdf4493753https://repositorio.elpoli.edu.co/bitstreams/1804b29f-dec4-4951-a92f-5c6893bf4dc1/download472812fcea495215bae6d804b759e7f4MD52AUTORIZACIÓN DE USO.pdfAUTORIZACIÓN DE USO.pdfapplication/pdf126680https://repositorio.elpoli.edu.co/bitstreams/e2fcc53f-0067-441a-9888-058fc7e982ca/download11366b27195a895f0cb5d1c670b7b96cMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-82614https://repositorio.elpoli.edu.co/bitstreams/03826895-fa97-4a71-ae32-e0cc8aff960d/download642f93b35eb56513c4d14578dcf73516MD51123456789/9027oai:repositorio.elpoli.edu.co:123456789/90272025-11-04 12:57:24.703https://repositorio.elpoli.edu.coRepositorio Institucional POLIJICrepositorio.polijic@gmail.comTElDRU5DSUEgREUgUFVCTElDQUNJw5NOIERFIERPQ1VNRU5UTwoKRUwgQVVUT1IsIG1hbmlmaWVzdGEgcXVlIGxhIG9icmEgb2JqZXRvIGRlIGxhIHByZXNlbnRlIGF1dG9yaXphY2nDs24gZXMgb3JpZ2luYWwKeSBsYSByZWFsaXrDsyBzaW4gdmlvbGFyIG8gdXN1cnBhciBkZXJlY2hvcyBkZSBhdXRvciBkZSB0ZXJjZXJvcywgcG9yIGxvIHRhbnRvLApsYSBvYnJhIGVzIGRlIGV4Y2x1c2l2YSBhdXRvcsOtYSB5IHRpZW5lIGxhIHRpdHVsYXJpZGFkIHNvYnJlIGxhIG1pc21hLgoKUEFSw4FHUkFGTzogRW4gY2FzbyBkZSBwcmVzZW50YXJzZSBjdWFscXVpZXIgcmVjbGFtYWNpw7NuIG8gYWNjacOzbiBwb3IgcGFydGUKZGUgdW4gdGVyY2VybyBlbiBjdWFudG8gYSBsb3MgZGVyZWNob3MgZGUgYXV0b3Igc29icmUgbGEgb2JyYSBlbiBjdWVzdGnDs24sCkVMIEFVVE9SLCBhc3VtaXLDoSB0b2RhIGxhIHJlc3BvbnNhYmlsaWRhZCwgeSBzYWxkcsOhIGVuIGRlZmVuc2EgZGUgbG9zIGRlcmVjaG9zCmFxdcOtIGF1dG9yaXphZG9zOyBwYXJhIHRvZG9zIGxvcyBlZmVjdG9zIGxhIHVuaXZlcnNpZGFkIGFjdMO6YSBjb21vIHVuIHRlcmNlcm8KZGUgYnVlbmEgZmUuCgpFTCBBVVRPUiwgYXV0b3JpemEgYWwgUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZCwgcGFyYSBxdWUKZW4gbG9zIHTDqXJtaW5vcyBlc3RhYmxlY2lkb3MgZW4gbGEgbGV5IDIzIGRlIDE5ODIsIGxleSA0NCBkZSAxOTkzLApkZWNpc2nDs24gQW5kaW5hIDM1MSBkZSAxOTkzLCBEZWNyZXRvIDQ2MCBkZSAxOTk1IHkgZGVtw6FzIG5vcm1hcyBnZW5lcmFsZXMKc29icmUgbGEgbWF0ZXJpYSwgbGEgcHVibGljYWNpw7NuIGRlIGxvcyBtZXRhZGF0b3MgYXF1w60gcmVnaXN0cmFkb3MgcGFyYSBmaW5lcwphY2Fkw6ltaWNvcyBlIGludmVzdGlnYXRpdm9zLiBFbiBmdW5jacOzbiBkZSBsbyBjdWFsLCBhbCBmaXJtYXIgeSBlbnZpYXIgZXN0YSBsaWNlbmNpYSwKRUwgQVVUT1Igb3RvcmdhIGFsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgZWwgZGVyZWNobyBOTyBFWENMVVNJVk8KZGUgYWxtYWNlbmFyLCByZXByb2R1Y2lyLCB0cmFkdWNpciB5IGRpdnVsZ2FyIGxvcyBtZXRhZGF0b3MgYXF1w60gcmVnaXN0cmFkb3MgZW4gZm9ybWF0bwppbXByZXNvLCBlbGVjdHLDs25pY28geSBlbiBjdWFscXVpZXIgbWVkaW8sIGluY2x1eWVuZG8sIHBlcm8gbm8gbGltaXRhZG8gYSBhdWRpbyBvIHbDrWRlbzsKeSBhY2VwdGEgcXVlIGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgcHVlZGUsIFNJTiBNT0RJRklDQVIKRUwgQ09OVEVOSURPIHkgUkVTUEVUQU5UTyBMT1MgREVSRUNIT1MgTU9SQUxFUywgZGlzcG9uZXIgZGUgbGEgcmVjdXBlcmFjacOzbiBkZSBpbmZvcm1hY2nDs24KcG9yIHBhcnRlIGRlIGNvc2VjaGFkb3JlcyBkZSBpbmZvcm1hY2nDs24gYXZhbGFkb3MgcG9yIGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQKeSBxdWUgZXN0b3MgbWV0YWRhdG9zIHNlYW4gcmVjdXBlcmFibGVzIHkgYWNjZXNpYmxlcyBjb24gZmluZXMgYWNhZMOpbWljb3MgZSBpbnZlc3RpZ2F0aXZvcy4KCkxvIGFudGVyaW9yLCBTSU4gUVVFIEVTVE8gQ09OTExFVkUgQSBRVUUgQUwgUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZApFU1TDiSBPQkxJR0FEQSBBIEJSSU5EQVIgQ09NUEVOU0FTScOTTiBNT05FVEFSSUEgQUwgQVVUT1IgcG9yIGFjdGl2aWRhZGVzIGRlIGRpdnVsZ2FjacOzbgp5IGxvcyBwb3NpYmxlcyBiZW5lZmljaW9zIGVjb27Ds21pY29zIHF1ZSBlc3RhIGRpdnVsZ2FjacOzbiBwdWVkYSBnZW5lcmFyIHBhcmEgZWwKUG9saXTDqWNuaWNvIENvbG9tYmlhbm8gSmFpbWUgSXNhemEgQ2FkYXZpZC4KCi0tLS0tLS0tLS0KUE9Mw41USUNBIERFIFRSQVRBTUlFTlRPIERFIERBVE9TIFBFUlNPTkFMRVMuCkRlY2xhcm8gcXVlIGF1dG9yaXpvIHByZXZpYSB5IGRlIGZvcm1hIGluZm9ybWFkYSBlbCB0cmF0YW1pZW50byBkZSBtaXMgZGF0b3MgcGVyc29uYWxlcwpwb3IgcGFydGUgZGVsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQgcGFyYSBmaW5lcyBhY2Fkw6ltaWNvcyB5IGVuCmFwbGljYWNpw7NuIGRlIGNvbnZlbmlvcyBjb24gdGVyY2Vyb3MgbyBzZXJ2aWNpb3MgY29uZXhvcyBjb24gYWN0aXZpZGFkZXMgcHJvcGlhcyBkZQpsYSBhY2FkZW1pYSwgY29uIGVzdHJpY3RvcyBjdW1wbGltaWVudG9zIGRlIGxvcyBwcmluY2lwaW9zIGRlIGxleSAxNTgxIGRlIDIwMTIuCgpEZSBpZ3VhbCBmb3JtYSBlbiBmdW5jacOzbiBkZWwgY29ycmVjdG8gZWplcmNpY2lvIGRlIG1pIGRlcmVjaG8gZGUgaGFiZWFzIGRhdGEgcHVlZG8KZW4gY3VhbHF1aWVyIG1vbWVudG8sIHByZXZpYSBpZGVudGlmaWNhY2nDs24sIHNvbGljaXRhciBsYSBjb25zdWx0YSwgY29ycmVjY2nDs24geQpzdXByZXNpw7NuIGRlIG1pcyBkYXRvcyBwb3IgbWVkaW8gZGUgY29tdW5pY2FjacOzbiBvZmljaWFsIGRpcmlnaWRhIGFsIFBvbGl0w6ljbmljbyBDb2xvbWJpYW5vIEphaW1lIElzYXphIENhZGF2aWQuCg== |
