Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización

RESUMEN : Se evaluaron cinco técnicas de imputación (interpolación lineal, media móvil, spline cúbico, KNN y MissForest) en 9 series de tiempo de caudales horarios de estaciones hidrológicas del departamento de Antioquia, con un 30%, 40% y 50% de datos faltantes simulados. Utilizando seis métricas d...

Full description

Autores:
Londoño García, Tomás
Tipo de recurso:
Tesis
Fecha de publicación:
2024
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/41736
Acceso en línea:
https://hdl.handle.net/10495/41736
Palabra clave:
Análisis de datos
Data analysis
Aprendizaje automático (inteligencia artificial)
Machine learning
Caudal de la corriente de agua
Stream flow
Datos nulos
Valores faltantes
Imputación de datos
Métodos determinísticos
http://aims.fao.org/aos/agrovoc/c_1cb3b243
http://vocabularies.unesco.org/thesaurus/concept2214
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
id UDEA2_2fdfa9a04d173bde4c5c6746c4f60007
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/41736
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
title Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
spellingShingle Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
Análisis de datos
Data analysis
Aprendizaje automático (inteligencia artificial)
Machine learning
Caudal de la corriente de agua
Stream flow
Datos nulos
Valores faltantes
Imputación de datos
Métodos determinísticos
http://aims.fao.org/aos/agrovoc/c_1cb3b243
http://vocabularies.unesco.org/thesaurus/concept2214
title_short Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
title_full Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
title_fullStr Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
title_full_unstemmed Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
title_sort Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
dc.creator.fl_str_mv Londoño García, Tomás
dc.contributor.advisor.none.fl_str_mv Parra Toro, Juan Camilo
dc.contributor.author.none.fl_str_mv Londoño García, Tomás
dc.subject.unesco.none.fl_str_mv Análisis de datos
Data analysis
topic Análisis de datos
Data analysis
Aprendizaje automático (inteligencia artificial)
Machine learning
Caudal de la corriente de agua
Stream flow
Datos nulos
Valores faltantes
Imputación de datos
Métodos determinísticos
http://aims.fao.org/aos/agrovoc/c_1cb3b243
http://vocabularies.unesco.org/thesaurus/concept2214
dc.subject.lemb.none.fl_str_mv Aprendizaje automático (inteligencia artificial)
Machine learning
dc.subject.agrovoc.none.fl_str_mv Caudal de la corriente de agua
Stream flow
dc.subject.proposal.spa.fl_str_mv Datos nulos
Valores faltantes
Imputación de datos
Métodos determinísticos
dc.subject.agrovocuri.none.fl_str_mv http://aims.fao.org/aos/agrovoc/c_1cb3b243
dc.subject.unescouri.none.fl_str_mv http://vocabularies.unesco.org/thesaurus/concept2214
description RESUMEN : Se evaluaron cinco técnicas de imputación (interpolación lineal, media móvil, spline cúbico, KNN y MissForest) en 9 series de tiempo de caudales horarios de estaciones hidrológicas del departamento de Antioquia, con un 30%, 40% y 50% de datos faltantes simulados. Utilizando seis métricas de evaluación (MSE, similitud, R², correlación de Spearman, coeficiente de variación y rango intercuartílico), se encontró que la interpolación lineal fue la técnica más precisa. El spline, si bien puede capturar tendencias a largo plazo, presentó dificultades para modelar picos y cambios bruscos en los caudales horarios. La media móvil, por otro lado, fue efectiva para suavizar la serie y capturar la tendencia general, pero no se adaptó bien a variaciones bruscas en los datos. Los métodos basados en modelos de aprendizaje automático (KNN y MissForest) presentaron un mayor costo computacional y, en general, resultados menos precisos. Estos resultados sugieren que, para series de tiempo de caudales horarios, con las características analizadas, la interpolación lineal podría ser una opción sólida y eficiente para imputar datos faltantes. Sin embargo, se recomienda evaluar otras técnicas en futuros estudios con diferentes características de los datos (como el uso de variables meteorológicas) y con ventanas de valores faltantes del orden de semanas.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-09-03T19:58:46Z
dc.date.available.none.fl_str_mv 2024-09-03T19:58:46Z
dc.date.issued.none.fl_str_mv 2024
dc.type.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Especialización
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_46ec
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/COther
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/other
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_46ec
status_str draft
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/10495/41736
url https://hdl.handle.net/10495/41736
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
https://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 55 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de Antioquia
dc.publisher.place.spa.fl_str_mv Medellín, Colombia
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería. Especialización en Manejo y Gestión del Agua
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/74e1916c-89ff-4f6a-acfe-deca9e11a9af/download
https://bibliotecadigital.udea.edu.co/bitstreams/84c33060-cbca-4377-a730-3986baeddc4b/download
https://bibliotecadigital.udea.edu.co/bitstreams/cbbd1f94-daf5-46c1-94f3-bec385318a9c/download
https://bibliotecadigital.udea.edu.co/bitstreams/636a7f76-0798-4b25-9256-26c433858690/download
https://bibliotecadigital.udea.edu.co/bitstreams/bd464725-cb82-4dfe-9e15-91116298b620/download
bitstream.checksum.fl_str_mv 43fd6fda283d75d2ca0476a2e251c986
e2060682c9c70d4d30c83c51448f4eed
8a4605be74aa9ea9d79846c1fba20a33
924302298becc0f3942cad43a5bcc0f5
6716d10736eca7dc68f8f8ed014bc772
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052627119308800
spelling Parra Toro, Juan CamiloLondoño García, Tomás2024-09-03T19:58:46Z2024-09-03T19:58:46Z2024https://hdl.handle.net/10495/41736RESUMEN : Se evaluaron cinco técnicas de imputación (interpolación lineal, media móvil, spline cúbico, KNN y MissForest) en 9 series de tiempo de caudales horarios de estaciones hidrológicas del departamento de Antioquia, con un 30%, 40% y 50% de datos faltantes simulados. Utilizando seis métricas de evaluación (MSE, similitud, R², correlación de Spearman, coeficiente de variación y rango intercuartílico), se encontró que la interpolación lineal fue la técnica más precisa. El spline, si bien puede capturar tendencias a largo plazo, presentó dificultades para modelar picos y cambios bruscos en los caudales horarios. La media móvil, por otro lado, fue efectiva para suavizar la serie y capturar la tendencia general, pero no se adaptó bien a variaciones bruscas en los datos. Los métodos basados en modelos de aprendizaje automático (KNN y MissForest) presentaron un mayor costo computacional y, en general, resultados menos precisos. Estos resultados sugieren que, para series de tiempo de caudales horarios, con las características analizadas, la interpolación lineal podría ser una opción sólida y eficiente para imputar datos faltantes. Sin embargo, se recomienda evaluar otras técnicas en futuros estudios con diferentes características de los datos (como el uso de variables meteorológicas) y con ventanas de valores faltantes del orden de semanas.EspecializaciónEspecialización en Manejo y Gestión del Agua55 páginasapplication/pdfspaUniversidad de AntioquiaMedellín, ColombiaFacultad de Ingeniería. Especialización en Manejo y Gestión del Aguahttp://creativecommons.org/licenses/by-nc-sa/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especializaciónTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftAnálisis de datosData analysisAprendizaje automático (inteligencia artificial)Machine learningCaudal de la corriente de aguaStream flowDatos nulosValores faltantesImputación de datosMétodos determinísticoshttp://aims.fao.org/aos/agrovoc/c_1cb3b243http://vocabularies.unesco.org/thesaurus/concept2214PublicationORIGINALLondoñoTomás_2024_ImputaciónDatosFaltantes.pdfLondoñoTomás_2024_ImputaciónDatosFaltantes.pdfTrabajo de grado de especializaciónapplication/pdf1984252https://bibliotecadigital.udea.edu.co/bitstreams/74e1916c-89ff-4f6a-acfe-deca9e11a9af/download43fd6fda283d75d2ca0476a2e251c986MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/84c33060-cbca-4377-a730-3986baeddc4b/downloade2060682c9c70d4d30c83c51448f4eedMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/cbbd1f94-daf5-46c1-94f3-bec385318a9c/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTEXTLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.txtLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.txtExtracted texttext/plain100554https://bibliotecadigital.udea.edu.co/bitstreams/636a7f76-0798-4b25-9256-26c433858690/download924302298becc0f3942cad43a5bcc0f5MD54falseAnonymousREADTHUMBNAILLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.jpgLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.jpgGenerated Thumbnailimage/jpeg6966https://bibliotecadigital.udea.edu.co/bitstreams/bd464725-cb82-4dfe-9e15-91116298b620/download6716d10736eca7dc68f8f8ed014bc772MD55falseAnonymousREAD10495/41736oai:bibliotecadigital.udea.edu.co:10495/417362025-03-27 01:16:52.026http://creativecommons.org/licenses/by-nc-sa/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=