Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín
RESUMEN : La deserción escolar entendiéndose como la interrupción, retiro o abandono del estudiante del sistema educativo, es un panorama educativo altamente problemático para el Estado y la sociedad en general, por su relación con la afectación al derecho fundamental del acceso a la educación y al...
- Autores:
-
Chamat Torres, Celger Paola
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2021
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/25045
- Acceso en línea:
- http://hdl.handle.net/10495/25045
- Palabra clave:
- Aprendizaje supervisado (aprendizaje automático)
Supervised learning (Machine learning)
Aprendizaje automático (inteligencia artificial)
Machine learning
Deserción escolar
Dropouts
Educación
Education
Técnicas de predicción
Forecasting techniques
Clasificación
Modelo predictivo
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc/2.5/co/
| id |
UDEA2_2a1235f35e4ebf17fbf4691b2a75cb79 |
|---|---|
| oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/25045 |
| network_acronym_str |
UDEA2 |
| network_name_str |
Repositorio UdeA |
| repository_id_str |
|
| dc.title.spa.fl_str_mv |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín |
| title |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín |
| spellingShingle |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín Aprendizaje supervisado (aprendizaje automático) Supervised learning (Machine learning) Aprendizaje automático (inteligencia artificial) Machine learning Deserción escolar Dropouts Educación Education Técnicas de predicción Forecasting techniques Clasificación Modelo predictivo |
| title_short |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín |
| title_full |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín |
| title_fullStr |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín |
| title_full_unstemmed |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín |
| title_sort |
Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de Medellín |
| dc.creator.fl_str_mv |
Chamat Torres, Celger Paola |
| dc.contributor.advisor.none.fl_str_mv |
Oviedo Carrascal, Efraín Alberto |
| dc.contributor.author.none.fl_str_mv |
Chamat Torres, Celger Paola |
| dc.subject.lemb.none.fl_str_mv |
Aprendizaje supervisado (aprendizaje automático) Supervised learning (Machine learning) Aprendizaje automático (inteligencia artificial) Machine learning Deserción escolar Dropouts Educación Education Técnicas de predicción Forecasting techniques |
| topic |
Aprendizaje supervisado (aprendizaje automático) Supervised learning (Machine learning) Aprendizaje automático (inteligencia artificial) Machine learning Deserción escolar Dropouts Educación Education Técnicas de predicción Forecasting techniques Clasificación Modelo predictivo |
| dc.subject.proposal.spa.fl_str_mv |
Clasificación Modelo predictivo |
| description |
RESUMEN : La deserción escolar entendiéndose como la interrupción, retiro o abandono del estudiante del sistema educativo, es un panorama educativo altamente problemático para el Estado y la sociedad en general, por su relación con la afectación al derecho fundamental del acceso a la educación y al desarrollo normal de un individuo en su etapa de escolaridad, soportado en el Artículo 67 de la Constitución Política de Colombia de 1991. Por ello, es de vital importancia para los entes reguladores velar y garantizar la permanencia educativa de todos los niños, jóvenes y adolescentes en su entorno escolar. Es allí, donde el gran potencial de los datos en conjunto con distintos actores multidisciplinarios permitiría la construcción de estrategias de control innovadoras y oportunas que respondan a las necesidades reales de la ciudadanía, aportando al mejoramiento de la calidad educativa y a los procesos de diagnóstico, planeación, ejecución, seguimiento y evaluación. Dada la necesidad de disminuir la tasa de estudiantes que abandonan el sistema educativo, se propone desarrollar un modelo predictivo de deserción estudiantil de Educación Preescolar, Básica y Media en el Municipio de Medellín, que permita a partir de técnicas de Machine Learning clasificar en posibles desertores (1) y no desertores (0) a aquellos estudiantes que según sus características académicas, sociodemográficas, socioeconómicas y familiares presentan un mayor riesgo de abandonar la escuela en el sector Oficial. Para la ejecución del proyecto se recolectó la fuente de información de matrícula al año 2019 suministrada por el Observatorio para la Calidad Educativa de Medellín (OCEM) de la Secretaría de Educación. A partir de la cual, se inició un proceso metodológico que consistió en la preparación de los datos para cruzar con un dataset complementario proveniente de la encuesta del Sisbén en la ciudad, el preprocesamiento de los datos para depurar, limpiar, imputar, transformar y codificar las variables, el balanceo de la clase minoritaria de la variable objetivo a partir de la técnica de sobremuestreo SMOTE, la implementación y entrenamiento de algoritmos de clasificación de aprendizaje supervisado tales como: RandomForestClassifier, StackingClassifier, BaggingClassifier de la librería de Scikit-Learn, así como una red neuronal con autoencoder de la plataforma TensorFlow y un algoritmo de ensemble XGBClassifier de XGBoost, finalizando el proceso con una validación de las métricas obtenidas en cada uno de los modelos y secuencia de iteraciones. Gracias a los resultados obtenidos en cada iteración realizada, fue posible ajustar los parámetros y definir las acciones de mejora en los datos y variables, con el fin de ir de manera progresiva aumentando el porcentaje de verdaderos positivos y disminuyendo la tasa de falsos negativos. Teniendo entonces como resultado final el mejor modelo de XGBClassifier, con una clasificación de los posibles desertores, es decir, de verdaderos positivos del 97% y aproximadamente el 100% de la clasificación de los no desertores. |
| publishDate |
2021 |
| dc.date.accessioned.none.fl_str_mv |
2021-12-14T14:16:21Z |
| dc.date.available.none.fl_str_mv |
2021-12-14T14:16:21Z |
| dc.date.issued.none.fl_str_mv |
2021 |
| dc.type.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Especialización |
| dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_46ec |
| dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/COther |
| dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
| dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/other |
| dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/draft |
| format |
http://purl.org/coar/resource_type/c_46ec |
| status_str |
draft |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10495/25045 |
| url |
http://hdl.handle.net/10495/25045 |
| dc.language.iso.spa.fl_str_mv |
spa |
| language |
spa |
| dc.relation.issupplementedby.spa.fl_str_mv |
https://github.com/CelgerpaoCh/UDEA_proyecto_desertores |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/co/ |
| dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc/2.5/co/ https://creativecommons.org/licenses/by-nc-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
| eu_rights_str_mv |
openAccess |
| dc.format.extent.spa.fl_str_mv |
53 |
| dc.format.mimetype.spa.fl_str_mv |
application/pdf |
| dc.publisher.spa.fl_str_mv |
Universidad de Antioquia |
| dc.publisher.place.spa.fl_str_mv |
Medellín |
| dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos |
| institution |
Universidad de Antioquia |
| bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstreams/90819ac4-e69a-4965-94e8-3696301a7ffe/download https://bibliotecadigital.udea.edu.co/bitstreams/91906be5-fc86-4c1e-a67f-d539c43e530a/download https://bibliotecadigital.udea.edu.co/bitstreams/42b3ccd5-0751-441a-bd34-f26c5dce012b/download https://bibliotecadigital.udea.edu.co/bitstreams/54ee2730-7978-4fed-94f7-03cb07ccc22b/download https://bibliotecadigital.udea.edu.co/bitstreams/cae89c7f-d3e4-40ac-8718-bad14b96cc6e/download |
| bitstream.checksum.fl_str_mv |
80ec0a59fd64a82f3b4bd4b1f51af99b c0c92b0ffc8b7d22d9cf56754a416a76 8a4605be74aa9ea9d79846c1fba20a33 bb6aa82942e13a46ca9c0e1ebf7c16be f432a975f23f6d7c999a46936a35a324 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad de Antioquia |
| repository.mail.fl_str_mv |
aplicacionbibliotecadigitalbiblioteca@udea.edu.co |
| _version_ |
1851052566218014720 |
| spelling |
Oviedo Carrascal, Efraín AlbertoChamat Torres, Celger Paola2021-12-14T14:16:21Z2021-12-14T14:16:21Z2021http://hdl.handle.net/10495/25045RESUMEN : La deserción escolar entendiéndose como la interrupción, retiro o abandono del estudiante del sistema educativo, es un panorama educativo altamente problemático para el Estado y la sociedad en general, por su relación con la afectación al derecho fundamental del acceso a la educación y al desarrollo normal de un individuo en su etapa de escolaridad, soportado en el Artículo 67 de la Constitución Política de Colombia de 1991. Por ello, es de vital importancia para los entes reguladores velar y garantizar la permanencia educativa de todos los niños, jóvenes y adolescentes en su entorno escolar. Es allí, donde el gran potencial de los datos en conjunto con distintos actores multidisciplinarios permitiría la construcción de estrategias de control innovadoras y oportunas que respondan a las necesidades reales de la ciudadanía, aportando al mejoramiento de la calidad educativa y a los procesos de diagnóstico, planeación, ejecución, seguimiento y evaluación. Dada la necesidad de disminuir la tasa de estudiantes que abandonan el sistema educativo, se propone desarrollar un modelo predictivo de deserción estudiantil de Educación Preescolar, Básica y Media en el Municipio de Medellín, que permita a partir de técnicas de Machine Learning clasificar en posibles desertores (1) y no desertores (0) a aquellos estudiantes que según sus características académicas, sociodemográficas, socioeconómicas y familiares presentan un mayor riesgo de abandonar la escuela en el sector Oficial. Para la ejecución del proyecto se recolectó la fuente de información de matrícula al año 2019 suministrada por el Observatorio para la Calidad Educativa de Medellín (OCEM) de la Secretaría de Educación. A partir de la cual, se inició un proceso metodológico que consistió en la preparación de los datos para cruzar con un dataset complementario proveniente de la encuesta del Sisbén en la ciudad, el preprocesamiento de los datos para depurar, limpiar, imputar, transformar y codificar las variables, el balanceo de la clase minoritaria de la variable objetivo a partir de la técnica de sobremuestreo SMOTE, la implementación y entrenamiento de algoritmos de clasificación de aprendizaje supervisado tales como: RandomForestClassifier, StackingClassifier, BaggingClassifier de la librería de Scikit-Learn, así como una red neuronal con autoencoder de la plataforma TensorFlow y un algoritmo de ensemble XGBClassifier de XGBoost, finalizando el proceso con una validación de las métricas obtenidas en cada uno de los modelos y secuencia de iteraciones. Gracias a los resultados obtenidos en cada iteración realizada, fue posible ajustar los parámetros y definir las acciones de mejora en los datos y variables, con el fin de ir de manera progresiva aumentando el porcentaje de verdaderos positivos y disminuyendo la tasa de falsos negativos. Teniendo entonces como resultado final el mejor modelo de XGBClassifier, con una clasificación de los posibles desertores, es decir, de verdaderos positivos del 97% y aproximadamente el 100% de la clasificación de los no desertores.EspecializaciónEspecialista en Analítica y Ciencia de Datos53application/pdfspaUniversidad de AntioquiaMedellínFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datoshttp://creativecommons.org/licenses/by-nc/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Modelo predictivo de deserción estudiantil de educación preescolar, básica y media en el municipio de MedellínTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftAprendizaje supervisado (aprendizaje automático)Supervised learning (Machine learning)Aprendizaje automático (inteligencia artificial)Machine learningDeserción escolarDropoutsEducaciónEducationTécnicas de predicciónForecasting techniquesClasificaciónModelo predictivohttps://github.com/CelgerpaoCh/UDEA_proyecto_desertoresPublicationORIGINALChamatCelger_2021_ModeloPredictivoEducativo.pdfChamatCelger_2021_ModeloPredictivoEducativo.pdfTrabajo de grado de especializaciónapplication/pdf2039609https://bibliotecadigital.udea.edu.co/bitstreams/90819ac4-e69a-4965-94e8-3696301a7ffe/download80ec0a59fd64a82f3b4bd4b1f51af99bMD510trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8933https://bibliotecadigital.udea.edu.co/bitstreams/91906be5-fc86-4c1e-a67f-d539c43e530a/downloadc0c92b0ffc8b7d22d9cf56754a416a76MD512falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/42b3ccd5-0751-441a-bd34-f26c5dce012b/download8a4605be74aa9ea9d79846c1fba20a33MD513falseAnonymousREADTEXTChamatCelger_2021_ModeloPredictivoEducativo.pdf.txtChamatCelger_2021_ModeloPredictivoEducativo.pdf.txtExtracted texttext/plain97623https://bibliotecadigital.udea.edu.co/bitstreams/54ee2730-7978-4fed-94f7-03cb07ccc22b/downloadbb6aa82942e13a46ca9c0e1ebf7c16beMD514falseAnonymousREADTHUMBNAILChamatCelger_2021_ModeloPredictivoEducativo.pdf.jpgChamatCelger_2021_ModeloPredictivoEducativo.pdf.jpgGenerated Thumbnailimage/jpeg6710https://bibliotecadigital.udea.edu.co/bitstreams/cae89c7f-d3e4-40ac-8718-bad14b96cc6e/downloadf432a975f23f6d7c999a46936a35a324MD515falseAnonymousREAD10495/25045oai:bibliotecadigital.udea.edu.co:10495/250452025-03-27 00:24:19.162http://creativecommons.org/licenses/by-nc/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
