Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio

Higher education faces persistent challenges in ensuring student accessibility and comprehension of content in theory-heavy courses. This project details the development of a web application designed to automatically transcribe class audio and contextualize the information to generate comprehensive...

Full description

Autores:
Benítez Avilez, Felipe José
Gómez Rosales, Laura Sofía
Valencia Gómez, Fernando Mateo
Tipo de recurso:
Fecha de publicación:
2025
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/13381
Acceso en línea:
http://hdl.handle.net/10584/13381
Palabra clave:
Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow
Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow
Rights
License
Universidad del Norte
id REPOUNORT2_17963c07ec1258a087c176bafafda132
oai_identifier_str oai:manglar.uninorte.edu.co:10584/13381
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
dc.title.en_US.fl_str_mv Development of an automatic transcription and contextualization system to generate study guides
title Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
spellingShingle Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow
Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow
title_short Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
title_full Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
title_fullStr Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
title_full_unstemmed Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
title_sort Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
dc.creator.fl_str_mv Benítez Avilez, Felipe José
Gómez Rosales, Laura Sofía
Valencia Gómez, Fernando Mateo
dc.contributor.advisor.none.fl_str_mv Zurek Varela, Eduardo
Romero Martínez, Daniel José
dc.contributor.author.none.fl_str_mv Benítez Avilez, Felipe José
Gómez Rosales, Laura Sofía
Valencia Gómez, Fernando Mateo
dc.subject.en_US.fl_str_mv Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow
topic Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow
Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow
dc.subject.es_ES.fl_str_mv Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow
description Higher education faces persistent challenges in ensuring student accessibility and comprehension of content in theory-heavy courses. This project details the development of a web application designed to automatically transcribe class audio and contextualize the information to generate comprehensive study guides, thereby enhancing student learning across various demanding disciplines. The system leverages a Vosk (Kaldi) Automatic Speech Recognition (ASR) model, fine-tuned for Latin American Spanish and academic discourse, to produce accurate transcriptions. These transcriptions are subsequently enriched by integrating student-taken notes and open-access bibliographic resources. The core output is the automatic generation of structured, referenced study guides, exportable in Markdown format. Key technologies employed include Python, ChromaDB for vectorial data management, and JavaScript for the web interface. This initiative aims to provide an open-source, adaptable solution to improve understanding and academic performance in subjects with high conceptual density.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-06-04T19:43:59Z
dc.date.available.none.fl_str_mv 2025-06-04T19:43:59Z
dc.date.issued.none.fl_str_mv 2025-05-30
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/13381
url http://hdl.handle.net/10584/13381
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv 'Barranquilla, Universidad del Norte, 2025
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/13381/1/Informe%20Final%20PF%20-%20Grupo%2012.pdf
https://manglar.uninorte.edu.co/bitstream/10584/13381/2/Poster%20PF%20-%20Grupo%20%2312.pdf
https://manglar.uninorte.edu.co/bitstream/10584/13381/3/license.txt
bitstream.checksum.fl_str_mv 51907080693231cc77a8257e500771f2
b13ddf5f5ac9132e67338f639eab5be1
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1836753992729755648
spelling Zurek Varela, EduardoRomero Martínez, Daniel JoséBenítez Avilez, Felipe JoséGómez Rosales, Laura SofíaValencia Gómez, Fernando Mateo2025-06-04T19:43:59Z2025-06-04T19:43:59Z2025-05-30http://hdl.handle.net/10584/13381Higher education faces persistent challenges in ensuring student accessibility and comprehension of content in theory-heavy courses. This project details the development of a web application designed to automatically transcribe class audio and contextualize the information to generate comprehensive study guides, thereby enhancing student learning across various demanding disciplines. The system leverages a Vosk (Kaldi) Automatic Speech Recognition (ASR) model, fine-tuned for Latin American Spanish and academic discourse, to produce accurate transcriptions. These transcriptions are subsequently enriched by integrating student-taken notes and open-access bibliographic resources. The core output is the automatic generation of structured, referenced study guides, exportable in Markdown format. Key technologies employed include Python, ChromaDB for vectorial data management, and JavaScript for the web interface. This initiative aims to provide an open-source, adaptable solution to improve understanding and academic performance in subjects with high conceptual density.La enseñanza superior se enfrenta a retos persistentes a la hora de garantizar la accesibilidad y la comprensión de los contenidos por parte de los estudiantes en cursos con gran carga teórica. Este proyecto detalla el desarrollo de una aplicación web diseñada para transcribir automáticamente el audio de las clases y contextualizar la información para generar guías de estudio completas, mejorando así el aprendizaje de los estudiantes en varias disciplinas exigentes. El sistema utiliza un modelo de reconocimiento automático del habla (ASR) de Vosk (Kaldi), adaptado al español latinoamericano y al discurso académico, para producir transcripciones precisas. Estas transcripciones se enriquecen posteriormente integrando las notas tomadas por los estudiantes y los recursos bibliográficos de libre acceso. El resultado principal es la generación automática de guías de estudio estructuradas y referenciadas, exportables en formato Markdown. Las principales tecnologías empleadas son Python, ChromaDB para la gestión de datos vectoriales y JavaScript para la interfaz web. Esta iniciativa pretende ofrecer una solución adaptable y de código abierto para mejorar la comprensión y el rendimiento académico en asignaturas con alta densidad conceptual.spa'Barranquilla, Universidad del Norte, 2025Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, MarkdowReconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, MarkdowDesarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudioDevelopment of an automatic transcription and contextualization system to generate study guidesarticlehttp://purl.org/coar/resource_type/c_6501Nieto Bernal, WilsonORIGINALInforme Final PF - Grupo 12.pdfInforme Final PF - Grupo 12.pdfArtículo principalapplication/pdf1936304https://manglar.uninorte.edu.co/bitstream/10584/13381/1/Informe%20Final%20PF%20-%20Grupo%2012.pdf51907080693231cc77a8257e500771f2MD51Poster PF - Grupo #12.pdfPoster PF - Grupo #12.pdfPosterapplication/pdf832576https://manglar.uninorte.edu.co/bitstream/10584/13381/2/Poster%20PF%20-%20Grupo%20%2312.pdfb13ddf5f5ac9132e67338f639eab5be1MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/13381/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310584/13381oai:manglar.uninorte.edu.co:10584/133812025-06-04 14:43:59.92Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=