Imputación de datos faltantes en series climáticas para la precipitación en el departamento del Meta

El trabajo de grado se centra en la imputación de datos faltantes para la variable de precipitación en el Departamento del Meta, Colombia. El objetivo de la investigación fue evaluar la eficacia de varios modelos de aprendizaje automático, incluidos KNN, XGBoost y Random Forest, en la imputación de...

Full description

Autores:
Hernández Mejia, Ronaldo
Velasco Zapata, Héctor Freddy
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad del Valle
Repositorio:
Repositorio Digital Univalle
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.univalle.edu.co:10893/33500
Acceso en línea:
https://hdl.handle.net/10893/33500
Palabra clave:
Inferencia estadística
Geoestadística
Estaciones de monitoreo
Instituto de Hidrología, Meteorología y Estudios Ambientales (IDEAM)
Meta (Colombia)
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Description
Summary:El trabajo de grado se centra en la imputación de datos faltantes para la variable de precipitación en el Departamento del Meta, Colombia. El objetivo de la investigación fue evaluar la eficacia de varios modelos de aprendizaje automático, incluidos KNN, XGBoost y Random Forest, en la imputación de datos faltantes. Durante la experimentación y evaluación de los modelos, se utilizaron métricas básicas como MAE (Mean Absolute Error), RMSE (Root Mean Squared Error), R2(Coeficiente de determinación) y MAPE (Mean Absolute Percentage Error). Estas métricas se utilizaron para medir y comparar la precisión y el rendimiento de cada modelo en el proceso de imputación de datos faltantes de precipitación. Además, se utilizaron métodos sofisticados para maximizar el rendimiento del proceso de imputación. Con el objetivo de mejorar la eficiencia computacional y acelerar el tiempo de ejecución de los modelos de imputación en grandes conjuntos de datos, se examinaron técnicas de paralelización de procesos utilizando bibliotecas como Dask y Joblib de Python.