Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín

RESUMEN : La deserción escolar entendiéndose como la interrupción, retiro o abandono del estudiante del sistema educativo, es un panorama educativo altamente problemático para el Estado y la sociedad en general, por su relación con la afectación al derecho fundamental del acceso a la educación y al...

Full description

Autores:
Chamat Torres, Celger Paola
Tipo de recurso:
Tesis
Fecha de publicación:
2021
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/25045
Acceso en línea:
http://hdl.handle.net/10495/25045
Palabra clave:
Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Aprendizaje automático (inteligencia artificial)
Machine learning
Deserción escolar
Dropouts
Educación
Education
Técnicas de predicción
Forecasting techniques
Clasificación
Modelo predictivo
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc/2.5/co/
id UDEA2_2a1235f35e4ebf17fbf4691b2a75cb79
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/25045
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
title Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
spellingShingle Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Aprendizaje automático (inteligencia artificial)
Machine learning
Deserción escolar
Dropouts
Educación
Education
Técnicas de predicción
Forecasting techniques
Clasificación
Modelo predictivo
title_short Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
title_full Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
title_fullStr Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
title_full_unstemmed Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
title_sort Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
dc.creator.fl_str_mv Chamat Torres, Celger Paola
dc.contributor.advisor.none.fl_str_mv Oviedo Carrascal, Efraín Alberto
dc.contributor.author.none.fl_str_mv Chamat Torres, Celger Paola
dc.subject.lemb.none.fl_str_mv Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Aprendizaje automático (inteligencia artificial)
Machine learning
Deserción escolar
Dropouts
Educación
Education
Técnicas de predicción
Forecasting techniques
topic Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Aprendizaje automático (inteligencia artificial)
Machine learning
Deserción escolar
Dropouts
Educación
Education
Técnicas de predicción
Forecasting techniques
Clasificación
Modelo predictivo
dc.subject.proposal.spa.fl_str_mv Clasificación
Modelo predictivo
description RESUMEN : La deserción escolar entendiéndose como la interrupción, retiro o abandono del estudiante del sistema educativo, es un panorama educativo altamente problemático para el Estado y la sociedad en general, por su relación con la afectación al derecho fundamental del acceso a la educación y al desarrollo normal de un individuo en su etapa de escolaridad, soportado en el Artículo 67 de la Constitución Política de Colombia de 1991. Por ello, es de vital importancia para los entes reguladores velar y garantizar la permanencia educativa de todos los niños, jóvenes y adolescentes en su entorno escolar. Es allí, donde el gran potencial de los datos en conjunto con distintos actores multidisciplinarios permitiría la construcción de estrategias de control innovadoras y oportunas que respondan a las necesidades reales de la ciudadanía, aportando al mejoramiento de la calidad educativa y a los procesos de diagnóstico, planeación, ejecución, seguimiento y evaluación. Dada la necesidad de disminuir la tasa de estudiantes que abandonan el sistema educativo, se propone desarrollar un modelo predictivo de deserción estudiantil de Educación Preescolar, Básica y Media en el Municipio de Medellín, que permita a partir de técnicas de Machine Learning clasificar en posibles desertores (1) y no desertores (0) a aquellos estudiantes que según sus características académicas, sociodemográficas, socioeconómicas y familiares presentan un mayor riesgo de abandonar la escuela en el sector Oficial. Para la ejecución del proyecto se recolectó la fuente de información de matrícula al año 2019 suministrada por el Observatorio para la Calidad Educativa de Medellín (OCEM) de la Secretaría de Educación. A partir de la cual, se inició un proceso metodológico que consistió en la preparación de los datos para cruzar con un dataset complementario proveniente de la encuesta del Sisbén en la ciudad, el preprocesamiento de los datos para depurar, limpiar, imputar, transformar y codificar las variables, el balanceo de la clase minoritaria de la variable objetivo a partir de la técnica de sobremuestreo SMOTE, la implementación y entrenamiento de algoritmos de clasificación de aprendizaje supervisado tales como: RandomForestClassifier, StackingClassifier, BaggingClassifier de la librería de Scikit-Learn, así como una red neuronal con autoencoder de la plataforma TensorFlow y un algoritmo de ensemble XGBClassifier de XGBoost, finalizando el proceso con una validación de las métricas obtenidas en cada uno de los modelos y secuencia de iteraciones. Gracias a los resultados obtenidos en cada iteración realizada, fue posible ajustar los parámetros y definir las acciones de mejora en los datos y variables, con el fin de ir de manera progresiva aumentando el porcentaje de verdaderos positivos y disminuyendo la tasa de falsos negativos. Teniendo entonces como resultado final el mejor modelo de XGBClassifier, con una clasificación de los posibles desertores, es decir, de verdaderos positivos del 97% y aproximadamente el 100% de la clasificación de los no desertores.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-12-14T14:16:21Z
dc.date.available.none.fl_str_mv 2021-12-14T14:16:21Z
dc.date.issued.none.fl_str_mv 2021
dc.type.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Especialización
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_46ec
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/COther
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/other
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_46ec
status_str draft
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10495/25045
url http://hdl.handle.net/10495/25045
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.issupplementedby.spa.fl_str_mv https://github.com/CelgerpaoCh/UDEA_proyecto_desertores
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/co/
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/2.5/co/
https://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 53
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de Antioquia
dc.publisher.place.spa.fl_str_mv Medellín
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/90819ac4-e69a-4965-94e8-3696301a7ffe/download
https://bibliotecadigital.udea.edu.co/bitstreams/91906be5-fc86-4c1e-a67f-d539c43e530a/download
https://bibliotecadigital.udea.edu.co/bitstreams/42b3ccd5-0751-441a-bd34-f26c5dce012b/download
https://bibliotecadigital.udea.edu.co/bitstreams/54ee2730-7978-4fed-94f7-03cb07ccc22b/download
https://bibliotecadigital.udea.edu.co/bitstreams/cae89c7f-d3e4-40ac-8718-bad14b96cc6e/download
bitstream.checksum.fl_str_mv 80ec0a59fd64a82f3b4bd4b1f51af99b
c0c92b0ffc8b7d22d9cf56754a416a76
8a4605be74aa9ea9d79846c1fba20a33
bb6aa82942e13a46ca9c0e1ebf7c16be
f432a975f23f6d7c999a46936a35a324
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052566218014720
spelling Oviedo Carrascal, Efraín AlbertoChamat Torres, Celger Paola2021-12-14T14:16:21Z2021-12-14T14:16:21Z2021http://hdl.handle.net/10495/25045RESUMEN : La deserción escolar entendiéndose como la interrupción, retiro o abandono del estudiante del sistema educativo, es un panorama educativo altamente problemático para el Estado y la sociedad en general, por su relación con la afectación al derecho fundamental del acceso a la educación y al desarrollo normal de un individuo en su etapa de escolaridad, soportado en el Artículo 67 de la Constitución Política de Colombia de 1991. Por ello, es de vital importancia para los entes reguladores velar y garantizar la permanencia educativa de todos los niños, jóvenes y adolescentes en su entorno escolar. Es allí, donde el gran potencial de los datos en conjunto con distintos actores multidisciplinarios permitiría la construcción de estrategias de control innovadoras y oportunas que respondan a las necesidades reales de la ciudadanía, aportando al mejoramiento de la calidad educativa y a los procesos de diagnóstico, planeación, ejecución, seguimiento y evaluación. Dada la necesidad de disminuir la tasa de estudiantes que abandonan el sistema educativo, se propone desarrollar un modelo predictivo de deserción estudiantil de Educación Preescolar, Básica y Media en el Municipio de Medellín, que permita a partir de técnicas de Machine Learning clasificar en posibles desertores (1) y no desertores (0) a aquellos estudiantes que según sus características académicas, sociodemográficas, socioeconómicas y familiares presentan un mayor riesgo de abandonar la escuela en el sector Oficial. Para la ejecución del proyecto se recolectó la fuente de información de matrícula al año 2019 suministrada por el Observatorio para la Calidad Educativa de Medellín (OCEM) de la Secretaría de Educación. A partir de la cual, se inició un proceso metodológico que consistió en la preparación de los datos para cruzar con un dataset complementario proveniente de la encuesta del Sisbén en la ciudad, el preprocesamiento de los datos para depurar, limpiar, imputar, transformar y codificar las variables, el balanceo de la clase minoritaria de la variable objetivo a partir de la técnica de sobremuestreo SMOTE, la implementación y entrenamiento de algoritmos de clasificación de aprendizaje supervisado tales como: RandomForestClassifier, StackingClassifier, BaggingClassifier de la librería de Scikit-Learn, así como una red neuronal con autoencoder de la plataforma TensorFlow y un algoritmo de ensemble XGBClassifier de XGBoost, finalizando el proceso con una validación de las métricas obtenidas en cada uno de los modelos y secuencia de iteraciones. Gracias a los resultados obtenidos en cada iteración realizada, fue posible ajustar los parámetros y definir las acciones de mejora en los datos y variables, con el fin de ir de manera progresiva aumentando el porcentaje de verdaderos positivos y disminuyendo la tasa de falsos negativos. Teniendo entonces como resultado final el mejor modelo de XGBClassifier, con una clasificación de los posibles desertores, es decir, de verdaderos positivos del 97% y aproximadamente el 100% de la clasificación de los no desertores.EspecializaciónEspecialista en Analítica y Ciencia de Datos53application/pdfspaUniversidad de AntioquiaMedellínFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datoshttp://creativecommons.org/licenses/by-nc/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de MedellínTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftAprendizaje supervisado (aprendizaje automático)Supervised learning (Machine learning)Aprendizaje automático (inteligencia artificial)Machine learningDeserción escolarDropoutsEducaciónEducationTécnicas de predicciónForecasting techniquesClasificaciónModelo predictivohttps://github.com/CelgerpaoCh/UDEA_proyecto_desertoresPublicationORIGINALChamatCelger_2021_ModeloPredictivoEducativo.pdfChamatCelger_2021_ModeloPredictivoEducativo.pdfTrabajo de grado de especializaciónapplication/pdf2039609https://bibliotecadigital.udea.edu.co/bitstreams/90819ac4-e69a-4965-94e8-3696301a7ffe/download80ec0a59fd64a82f3b4bd4b1f51af99bMD510trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8933https://bibliotecadigital.udea.edu.co/bitstreams/91906be5-fc86-4c1e-a67f-d539c43e530a/downloadc0c92b0ffc8b7d22d9cf56754a416a76MD512falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/42b3ccd5-0751-441a-bd34-f26c5dce012b/download8a4605be74aa9ea9d79846c1fba20a33MD513falseAnonymousREADTEXTChamatCelger_2021_ModeloPredictivoEducativo.pdf.txtChamatCelger_2021_ModeloPredictivoEducativo.pdf.txtExtracted texttext/plain97623https://bibliotecadigital.udea.edu.co/bitstreams/54ee2730-7978-4fed-94f7-03cb07ccc22b/downloadbb6aa82942e13a46ca9c0e1ebf7c16beMD514falseAnonymousREADTHUMBNAILChamatCelger_2021_ModeloPredictivoEducativo.pdf.jpgChamatCelger_2021_ModeloPredictivoEducativo.pdf.jpgGenerated Thumbnailimage/jpeg6710https://bibliotecadigital.udea.edu.co/bitstreams/cae89c7f-d3e4-40ac-8718-bad14b96cc6e/downloadf432a975f23f6d7c999a46936a35a324MD515falseAnonymousREAD10495/25045oai:bibliotecadigital.udea.edu.co:10495/250452025-03-27 00:24:19.162http://creativecommons.org/licenses/by-nc/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=