Modelo de aprendizaje de máquina para la verificación de la calidad de los datos en actualizaciones catastrales en municipios de Casanare
En el contexto de la actualización catastral en Colombia y su importancia para la toma de decisiones gubernamentales, la calidad de los datos desempeña un papel crucial en el desarrollo adecuado de los procesos catastrales. Es necesario agilizar estos procesos, hacerlos más eficientes y evitar las i...
- Autores:
-
Benavides Tocarruncho, Natalia
Escobar Calderón, Santiago
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad Distrital Francisco José de Caldas
- Repositorio:
- RIUD: repositorio U. Distrital
- Idioma:
- spa
- OAI Identifier:
- oai:repository.udistrital.edu.co:11349/52702
- Acceso en línea:
- http://hdl.handle.net/11349/52702
- Palabra clave:
- Aprendizaje de maquina
Calidad de datos catastrales
Verificación de datos
Análisis geoespacial
Actualización catastral
Ingeniería Catastral y Geodesia -- Tesis y disertaciones académicas
Análisis de información -- Información
Reconocimientos topográficos -- Topografía
Procesamiento electrónico de datos -- Bases de datos
Machine learning
Cadastral data quality
Data verification
Geospatial analysis
Cadastral update
- Rights
- License
- Abierto (Texto Completo)
Summary: | En el contexto de la actualización catastral en Colombia y su importancia para la toma de decisiones gubernamentales, la calidad de los datos desempeña un papel crucial en el desarrollo adecuado de los procesos catastrales. Es necesario agilizar estos procesos, hacerlos más eficientes y evitar las inconsistencias establecidas en los modelos de calidad definidos por el Instituto Geográfico Agustín Codazzi (IGAC) para avanzar en dichos procesos. La aplicación de tecnologías como el aprendizaje maquina contribuye a aumentar la eficiencia en estos procedimientos. Como solución, se propuso un modelo de aprendizaje de maquina para verificar la calidad de los datos catastrales de municipios del departamento de Casanare mediante la definición de cuatro niveles de calidad y la selección de variables que representan la realidad territorial. En total, se seleccionaron 20 variables, entre las cuales las más influyentes fueron el área del terreno (alfanumérica y digital), el folio de matrícula, el tipo de dominio y la destinación económica. Las variables con mayor inconsistencia fueron el área registral, el área catastral, la información de nombre completo, y los registros de personas jurídicas y naturales, así como la discrepancia entre el área registral y la calculada. Los cuatro niveles se dividen en la verificación de la totalidad de la información, la estructura del número predial nacional, el cumplimiento de reglas de consistencia y validaciones de topológicas. De los datos de los predios evaluados, un 70% cumple con los parámetros de calidad, lo que revela una necesidad implementar nuevos procesos, como el presentado, para de manejo y registro de información de manera más adecuada. Adicional a esto el desempeño del modelo tuvo un RSME del 0.0317, un MAE del 0.0185 y un R2 Score de 0.6629, lo que indica buen desempeño, cercanía a valores reales con los predichos y variabilidad en los datos con posibilidades de mejora. |
---|