Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio
Higher education faces persistent challenges in ensuring student accessibility and comprehension of content in theory-heavy courses. This project details the development of a web application designed to automatically transcribe class audio and contextualize the information to generate comprehensive...
- Autores:
-
Benítez Avilez, Felipe José
Gómez Rosales, Laura Sofía
Valencia Gómez, Fernando Mateo
- Tipo de recurso:
- Fecha de publicación:
- 2025
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/13381
- Acceso en línea:
- http://hdl.handle.net/10584/13381
- Palabra clave:
- Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow
Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow
- Rights
- License
- Universidad del Norte
id |
REPOUNORT2_17963c07ec1258a087c176bafafda132 |
---|---|
oai_identifier_str |
oai:manglar.uninorte.edu.co:10584/13381 |
network_acronym_str |
REPOUNORT2 |
network_name_str |
Repositorio Uninorte |
repository_id_str |
|
dc.title.es_ES.fl_str_mv |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio |
dc.title.en_US.fl_str_mv |
Development of an automatic transcription and contextualization system to generate study guides |
title |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio |
spellingShingle |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow |
title_short |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio |
title_full |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio |
title_fullStr |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio |
title_full_unstemmed |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio |
title_sort |
Desarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudio |
dc.creator.fl_str_mv |
Benítez Avilez, Felipe José Gómez Rosales, Laura Sofía Valencia Gómez, Fernando Mateo |
dc.contributor.advisor.none.fl_str_mv |
Zurek Varela, Eduardo Romero Martínez, Daniel José |
dc.contributor.author.none.fl_str_mv |
Benítez Avilez, Felipe José Gómez Rosales, Laura Sofía Valencia Gómez, Fernando Mateo |
dc.subject.en_US.fl_str_mv |
Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow |
topic |
Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, Markdow Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow |
dc.subject.es_ES.fl_str_mv |
Reconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, Markdow |
description |
Higher education faces persistent challenges in ensuring student accessibility and comprehension of content in theory-heavy courses. This project details the development of a web application designed to automatically transcribe class audio and contextualize the information to generate comprehensive study guides, thereby enhancing student learning across various demanding disciplines. The system leverages a Vosk (Kaldi) Automatic Speech Recognition (ASR) model, fine-tuned for Latin American Spanish and academic discourse, to produce accurate transcriptions. These transcriptions are subsequently enriched by integrating student-taken notes and open-access bibliographic resources. The core output is the automatic generation of structured, referenced study guides, exportable in Markdown format. Key technologies employed include Python, ChromaDB for vectorial data management, and JavaScript for the web interface. This initiative aims to provide an open-source, adaptable solution to improve understanding and academic performance in subjects with high conceptual density. |
publishDate |
2025 |
dc.date.accessioned.none.fl_str_mv |
2025-06-04T19:43:59Z |
dc.date.available.none.fl_str_mv |
2025-06-04T19:43:59Z |
dc.date.issued.none.fl_str_mv |
2025-05-30 |
dc.type.es_ES.fl_str_mv |
article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10584/13381 |
url |
http://hdl.handle.net/10584/13381 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
Universidad del Norte |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Universidad del Norte http://purl.org/coar/access_right/c_abf2 |
dc.publisher.es_ES.fl_str_mv |
'Barranquilla, Universidad del Norte, 2025 |
institution |
Universidad del Norte |
bitstream.url.fl_str_mv |
https://manglar.uninorte.edu.co/bitstream/10584/13381/1/Informe%20Final%20PF%20-%20Grupo%2012.pdf https://manglar.uninorte.edu.co/bitstream/10584/13381/2/Poster%20PF%20-%20Grupo%20%2312.pdf https://manglar.uninorte.edu.co/bitstream/10584/13381/3/license.txt |
bitstream.checksum.fl_str_mv |
51907080693231cc77a8257e500771f2 b13ddf5f5ac9132e67338f639eab5be1 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital de la Universidad del Norte |
repository.mail.fl_str_mv |
mauribe@uninorte.edu.co |
_version_ |
1836753992729755648 |
spelling |
Zurek Varela, EduardoRomero Martínez, Daniel JoséBenítez Avilez, Felipe JoséGómez Rosales, Laura SofíaValencia Gómez, Fernando Mateo2025-06-04T19:43:59Z2025-06-04T19:43:59Z2025-05-30http://hdl.handle.net/10584/13381Higher education faces persistent challenges in ensuring student accessibility and comprehension of content in theory-heavy courses. This project details the development of a web application designed to automatically transcribe class audio and contextualize the information to generate comprehensive study guides, thereby enhancing student learning across various demanding disciplines. The system leverages a Vosk (Kaldi) Automatic Speech Recognition (ASR) model, fine-tuned for Latin American Spanish and academic discourse, to produce accurate transcriptions. These transcriptions are subsequently enriched by integrating student-taken notes and open-access bibliographic resources. The core output is the automatic generation of structured, referenced study guides, exportable in Markdown format. Key technologies employed include Python, ChromaDB for vectorial data management, and JavaScript for the web interface. This initiative aims to provide an open-source, adaptable solution to improve understanding and academic performance in subjects with high conceptual density.La enseñanza superior se enfrenta a retos persistentes a la hora de garantizar la accesibilidad y la comprensión de los contenidos por parte de los estudiantes en cursos con gran carga teórica. Este proyecto detalla el desarrollo de una aplicación web diseñada para transcribir automáticamente el audio de las clases y contextualizar la información para generar guías de estudio completas, mejorando así el aprendizaje de los estudiantes en varias disciplinas exigentes. El sistema utiliza un modelo de reconocimiento automático del habla (ASR) de Vosk (Kaldi), adaptado al español latinoamericano y al discurso académico, para producir transcripciones precisas. Estas transcripciones se enriquecen posteriormente integrando las notas tomadas por los estudiantes y los recursos bibliográficos de libre acceso. El resultado principal es la generación automática de guías de estudio estructuradas y referenciadas, exportables en formato Markdown. Las principales tecnologías empleadas son Python, ChromaDB para la gestión de datos vectoriales y JavaScript para la interfaz web. Esta iniciativa pretende ofrecer una solución adaptable y de código abierto para mejorar la comprensión y el rendimiento académico en asignaturas con alta densidad conceptual.spa'Barranquilla, Universidad del Norte, 2025Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Automatic Speech Recognition (ASR), Natural Language Processing (NLP), Educational Technology, Higher Education, Contextualization, Fine-tuning, Study Guides, Latin American Spanish, Vector Search, MarkdowReconocimiento automático del habla (ASR), Procesamiento del lenguaje natural (PLN), Tecnología educativa, Educación superior, Contextualización, Ajuste, Guías de estudio, Español latinoamericano, Búsqueda vectorial, MarkdowDesarrollo de un sistema de transcripción y contextualización automática para la generación de guías de estudioDevelopment of an automatic transcription and contextualization system to generate study guidesarticlehttp://purl.org/coar/resource_type/c_6501Nieto Bernal, WilsonORIGINALInforme Final PF - Grupo 12.pdfInforme Final PF - Grupo 12.pdfArtículo principalapplication/pdf1936304https://manglar.uninorte.edu.co/bitstream/10584/13381/1/Informe%20Final%20PF%20-%20Grupo%2012.pdf51907080693231cc77a8257e500771f2MD51Poster PF - Grupo #12.pdfPoster PF - Grupo #12.pdfPosterapplication/pdf832576https://manglar.uninorte.edu.co/bitstream/10584/13381/2/Poster%20PF%20-%20Grupo%20%2312.pdfb13ddf5f5ac9132e67338f639eab5be1MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/13381/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310584/13381oai:manglar.uninorte.edu.co:10584/133812025-06-04 14:43:59.92Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |