Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización
RESUMEN : Se evaluaron cinco técnicas de imputación (interpolación lineal, media móvil, spline cúbico, KNN y MissForest) en 9 series de tiempo de caudales horarios de estaciones hidrológicas del departamento de Antioquia, con un 30%, 40% y 50% de datos faltantes simulados. Utilizando seis métricas d...
- Autores:
-
Londoño García, Tomás
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2024
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/41736
- Acceso en línea:
- https://hdl.handle.net/10495/41736
- Palabra clave:
- Análisis de datos
Data analysis
Aprendizaje automático (inteligencia artificial)
Machine learning
Caudal de la corriente de agua
Stream flow
Datos nulos
Valores faltantes
Imputación de datos
Métodos determinísticos
http://aims.fao.org/aos/agrovoc/c_1cb3b243
http://vocabularies.unesco.org/thesaurus/concept2214
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/2.5/co/
| id |
UDEA2_2fdfa9a04d173bde4c5c6746c4f60007 |
|---|---|
| oai_identifier_str |
oai:bibliotecadigital.udea.edu.co:10495/41736 |
| network_acronym_str |
UDEA2 |
| network_name_str |
Repositorio UdeA |
| repository_id_str |
|
| dc.title.spa.fl_str_mv |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
| title |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
| spellingShingle |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización Análisis de datos Data analysis Aprendizaje automático (inteligencia artificial) Machine learning Caudal de la corriente de agua Stream flow Datos nulos Valores faltantes Imputación de datos Métodos determinísticos http://aims.fao.org/aos/agrovoc/c_1cb3b243 http://vocabularies.unesco.org/thesaurus/concept2214 |
| title_short |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
| title_full |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
| title_fullStr |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
| title_full_unstemmed |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
| title_sort |
Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especialización |
| dc.creator.fl_str_mv |
Londoño García, Tomás |
| dc.contributor.advisor.none.fl_str_mv |
Parra Toro, Juan Camilo |
| dc.contributor.author.none.fl_str_mv |
Londoño García, Tomás |
| dc.subject.unesco.none.fl_str_mv |
Análisis de datos Data analysis |
| topic |
Análisis de datos Data analysis Aprendizaje automático (inteligencia artificial) Machine learning Caudal de la corriente de agua Stream flow Datos nulos Valores faltantes Imputación de datos Métodos determinísticos http://aims.fao.org/aos/agrovoc/c_1cb3b243 http://vocabularies.unesco.org/thesaurus/concept2214 |
| dc.subject.lemb.none.fl_str_mv |
Aprendizaje automático (inteligencia artificial) Machine learning |
| dc.subject.agrovoc.none.fl_str_mv |
Caudal de la corriente de agua Stream flow |
| dc.subject.proposal.spa.fl_str_mv |
Datos nulos Valores faltantes Imputación de datos Métodos determinísticos |
| dc.subject.agrovocuri.none.fl_str_mv |
http://aims.fao.org/aos/agrovoc/c_1cb3b243 |
| dc.subject.unescouri.none.fl_str_mv |
http://vocabularies.unesco.org/thesaurus/concept2214 |
| description |
RESUMEN : Se evaluaron cinco técnicas de imputación (interpolación lineal, media móvil, spline cúbico, KNN y MissForest) en 9 series de tiempo de caudales horarios de estaciones hidrológicas del departamento de Antioquia, con un 30%, 40% y 50% de datos faltantes simulados. Utilizando seis métricas de evaluación (MSE, similitud, R², correlación de Spearman, coeficiente de variación y rango intercuartílico), se encontró que la interpolación lineal fue la técnica más precisa. El spline, si bien puede capturar tendencias a largo plazo, presentó dificultades para modelar picos y cambios bruscos en los caudales horarios. La media móvil, por otro lado, fue efectiva para suavizar la serie y capturar la tendencia general, pero no se adaptó bien a variaciones bruscas en los datos. Los métodos basados en modelos de aprendizaje automático (KNN y MissForest) presentaron un mayor costo computacional y, en general, resultados menos precisos. Estos resultados sugieren que, para series de tiempo de caudales horarios, con las características analizadas, la interpolación lineal podría ser una opción sólida y eficiente para imputar datos faltantes. Sin embargo, se recomienda evaluar otras técnicas en futuros estudios con diferentes características de los datos (como el uso de variables meteorológicas) y con ventanas de valores faltantes del orden de semanas. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2024-09-03T19:58:46Z |
| dc.date.available.none.fl_str_mv |
2024-09-03T19:58:46Z |
| dc.date.issued.none.fl_str_mv |
2024 |
| dc.type.spa.fl_str_mv |
Tesis/Trabajo de grado - Monografía - Especialización |
| dc.type.coar.spa.fl_str_mv |
http://purl.org/coar/resource_type/c_46ec |
| dc.type.redcol.spa.fl_str_mv |
http://purl.org/redcol/resource_type/COther |
| dc.type.coarversion.spa.fl_str_mv |
http://purl.org/coar/version/c_b1a7d7d4d402bcce |
| dc.type.driver.spa.fl_str_mv |
info:eu-repo/semantics/other |
| dc.type.version.spa.fl_str_mv |
info:eu-repo/semantics/draft |
| format |
http://purl.org/coar/resource_type/c_46ec |
| status_str |
draft |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/10495/41736 |
| url |
https://hdl.handle.net/10495/41736 |
| dc.language.iso.spa.fl_str_mv |
spa |
| language |
spa |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ |
| dc.rights.uri.spa.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.rights.accessrights.spa.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.coar.spa.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/co/ https://creativecommons.org/licenses/by-nc-sa/4.0/ http://purl.org/coar/access_right/c_abf2 |
| eu_rights_str_mv |
openAccess |
| dc.format.extent.spa.fl_str_mv |
55 páginas |
| dc.format.mimetype.spa.fl_str_mv |
application/pdf |
| dc.publisher.spa.fl_str_mv |
Universidad de Antioquia |
| dc.publisher.place.spa.fl_str_mv |
Medellín, Colombia |
| dc.publisher.faculty.spa.fl_str_mv |
Facultad de Ingeniería. Especialización en Manejo y Gestión del Agua |
| institution |
Universidad de Antioquia |
| bitstream.url.fl_str_mv |
https://bibliotecadigital.udea.edu.co/bitstreams/74e1916c-89ff-4f6a-acfe-deca9e11a9af/download https://bibliotecadigital.udea.edu.co/bitstreams/84c33060-cbca-4377-a730-3986baeddc4b/download https://bibliotecadigital.udea.edu.co/bitstreams/cbbd1f94-daf5-46c1-94f3-bec385318a9c/download https://bibliotecadigital.udea.edu.co/bitstreams/636a7f76-0798-4b25-9256-26c433858690/download https://bibliotecadigital.udea.edu.co/bitstreams/bd464725-cb82-4dfe-9e15-91116298b620/download |
| bitstream.checksum.fl_str_mv |
43fd6fda283d75d2ca0476a2e251c986 e2060682c9c70d4d30c83c51448f4eed 8a4605be74aa9ea9d79846c1fba20a33 924302298becc0f3942cad43a5bcc0f5 6716d10736eca7dc68f8f8ed014bc772 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad de Antioquia |
| repository.mail.fl_str_mv |
aplicacionbibliotecadigitalbiblioteca@udea.edu.co |
| _version_ |
1851052627119308800 |
| spelling |
Parra Toro, Juan CamiloLondoño García, Tomás2024-09-03T19:58:46Z2024-09-03T19:58:46Z2024https://hdl.handle.net/10495/41736RESUMEN : Se evaluaron cinco técnicas de imputación (interpolación lineal, media móvil, spline cúbico, KNN y MissForest) en 9 series de tiempo de caudales horarios de estaciones hidrológicas del departamento de Antioquia, con un 30%, 40% y 50% de datos faltantes simulados. Utilizando seis métricas de evaluación (MSE, similitud, R², correlación de Spearman, coeficiente de variación y rango intercuartílico), se encontró que la interpolación lineal fue la técnica más precisa. El spline, si bien puede capturar tendencias a largo plazo, presentó dificultades para modelar picos y cambios bruscos en los caudales horarios. La media móvil, por otro lado, fue efectiva para suavizar la serie y capturar la tendencia general, pero no se adaptó bien a variaciones bruscas en los datos. Los métodos basados en modelos de aprendizaje automático (KNN y MissForest) presentaron un mayor costo computacional y, en general, resultados menos precisos. Estos resultados sugieren que, para series de tiempo de caudales horarios, con las características analizadas, la interpolación lineal podría ser una opción sólida y eficiente para imputar datos faltantes. Sin embargo, se recomienda evaluar otras técnicas en futuros estudios con diferentes características de los datos (como el uso de variables meteorológicas) y con ventanas de valores faltantes del orden de semanas.EspecializaciónEspecialización en Manejo y Gestión del Agua55 páginasapplication/pdfspaUniversidad de AntioquiaMedellín, ColombiaFacultad de Ingeniería. Especialización en Manejo y Gestión del Aguahttp://creativecommons.org/licenses/by-nc-sa/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Imputación de datos faltantes en caudales de fuentes hídricas del departamento de Antioquia: Un análisis comparativo de métodos tradicionales y basados en aprendizaje automático. Trabajo de grado de especializaciónTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftAnálisis de datosData analysisAprendizaje automático (inteligencia artificial)Machine learningCaudal de la corriente de aguaStream flowDatos nulosValores faltantesImputación de datosMétodos determinísticoshttp://aims.fao.org/aos/agrovoc/c_1cb3b243http://vocabularies.unesco.org/thesaurus/concept2214PublicationORIGINALLondoñoTomás_2024_ImputaciónDatosFaltantes.pdfLondoñoTomás_2024_ImputaciónDatosFaltantes.pdfTrabajo de grado de especializaciónapplication/pdf1984252https://bibliotecadigital.udea.edu.co/bitstreams/74e1916c-89ff-4f6a-acfe-deca9e11a9af/download43fd6fda283d75d2ca0476a2e251c986MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/84c33060-cbca-4377-a730-3986baeddc4b/downloade2060682c9c70d4d30c83c51448f4eedMD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/cbbd1f94-daf5-46c1-94f3-bec385318a9c/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTEXTLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.txtLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.txtExtracted texttext/plain100554https://bibliotecadigital.udea.edu.co/bitstreams/636a7f76-0798-4b25-9256-26c433858690/download924302298becc0f3942cad43a5bcc0f5MD54falseAnonymousREADTHUMBNAILLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.jpgLondoñoTomás_2024_ImputaciónDatosFaltantes.pdf.jpgGenerated Thumbnailimage/jpeg6966https://bibliotecadigital.udea.edu.co/bitstreams/bd464725-cb82-4dfe-9e15-91116298b620/download6716d10736eca7dc68f8f8ed014bc772MD55falseAnonymousREAD10495/41736oai:bibliotecadigital.udea.edu.co:10495/417362025-03-27 01:16:52.026http://creativecommons.org/licenses/by-nc-sa/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
