Desarrollo de modelo clasificación para determinar el riesgo de deserción estudiantil de los beneficiarios de pregrado en una entidad que ofrece créditos estudiantiles en Medellín

En Colombia, diversas entidades, tanto públicas como privadas, comprometidas con el fortalecimiento de la educación superior, han incentivado programas de créditos condonables para facilitar el acceso y la permanencia de los estudiantes. En Medellín, una entidad pública que implementa este tipo de a...

Full description

Autores:
Aristizabal Echeverri, Genaro Alfonso
Cuaran Rosero, Euler Leonardo
Tipo de recurso:
Tesis
Fecha de publicación:
2025
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/46717
Acceso en línea:
https://hdl.handle.net/10495/46717
Palabra clave:
Deserción universitaria
College dropouts
Aprendizaje automático (inteligencia artificial)
Machine learning
Crédito educativo
Student loan funds
CatBoost Classifier
Medellín
ODS 4: Educación de calidad. Garantizar una educación inclusiva y equitativa de calidad y promover oportunidades de aprendizaje permanente para todos
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
Description
Summary:En Colombia, diversas entidades, tanto públicas como privadas, comprometidas con el fortalecimiento de la educación superior, han incentivado programas de créditos condonables para facilitar el acceso y la permanencia de los estudiantes. En Medellín, una entidad pública que implementa este tipo de apoyos ha buscado fortalecer sus estrategias institucionales para anticipar los casos de deserción estudiantil. Por ello, se creó un modelo de clasificación que utiliza técnicas de aprendizaje automático, con el objetivo de identificar a los beneficiarios activos que puedan ser clasificados como posibles desertores a lo largo de su trayectoria académica en la entidad. Para el desarrollo del modelo, se utilizó un registro histórico por estudiante, abarcando el periodo 2019–2025. A partir de este conjunto de datos, se seleccionaron once variables, elegidas tras realizar análisis descriptivos. Estas variables incluían información académica, transaccional, socioeconómica y sociodemográfica. El proceso metodológico abarcó etapas de limpieza, transformación de datos y la comparación de varios algoritmos de clasificación. En conjunto, el modelo sirvió como herramienta de apoyo al área de permanencia de la entidad, para la toma de decisiones encaminadas a acompañar a los estudiantes que tienen riesgo de desertar del programa.