Evaluación de algoritmos de aprendizaje automático en la clasificación supervisada de imágenes satelitales multitemporales para el análisis de coberturas de suelo en Rionegro, Colombia

RESUMEN : El análisis de coberturas de suelo mediante algoritmos de aprendizaje automático es fundamental para la gestión sostenible del territorio, especialmente en contextos de alta complejidad como Rionegro, Antioquia, Colombia. Este estudio implementa una metodología robusta para evaluar el dese...

Full description

Autores:
Cossio Madrid, Oscar Estevan
Herrera Palacio, Jhon Sebastian
Tipo de recurso:
Tesis
Fecha de publicación:
2024
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/44537
Acceso en línea:
https://hdl.handle.net/10495/44537
Palabra clave:
Aprendizaje automático (inteligencia artificial)
Machine learning
Cobertura de suelos
Land cover
Sistema de información geográfica
Geographical information systems
Teledetección
Remote sensing
Clasificación supervisada
Validación cruzada
http://aims.fao.org/aos/agrovoc/c_37897
http://aims.fao.org/aos/agrovoc/c_35131
http://aims.fao.org/aos/agrovoc/c_6498
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc-sa/4.0/
Description
Summary:RESUMEN : El análisis de coberturas de suelo mediante algoritmos de aprendizaje automático es fundamental para la gestión sostenible del territorio, especialmente en contextos de alta complejidad como Rionegro, Antioquia, Colombia. Este estudio implementa una metodología robusta para evaluar el desempeño de cinco algoritmos de clasificación supervisada (Random Forest, K-Nearest Neighbors, Naive Bayes, Gradient Boosting y CART) utilizando imágenes Sentinel-2 multiespectrales procesadas en Google Earth Engine (GEE). La investigación integra preprocesamiento avanzado, enmascaramiento de nubes, cálculo de índices espectrales (NDVI, NDBI, NDWI) y balanceo de clases mediante SMOTE para abordar problemas de desbalance en los datos. Los resultados muestran que Random Forest se destaca con una precisión global promedio del 83%, un índice Kappa de 0.81 y valores de área bajo la curva (AUC) superiores a 0.9 en las principales clases de cobertura. El algoritmo KNN, aunque menos robusto, logró desempeños aceptables en clases con características espectrales bien diferenciadas. Por el contrario, Naive Bayes y CART demostraron limitaciones importantes, reflejadas en precisiones globales inferiores al 30% y un índice Kappa cercano a cero, atribuibles a la alta fragmentación del paisaje y el solapamiento espectral. El análisis de curvas ROC y matrices de confusión resalta que las clases relacionadas con áreas urbanas y cuerpos de agua presentan la mejor discriminación, mientras que las clases agrícolas y de vegetación mixta son más propensas a errores.