Análisis de agrupamiento de distintos tipos de hurtos en la ciudad de Medellín

El presente estudio aborda los datos correspondientes a las denuncias de distintos tipos de hurtos ocurridos en la ciudad de Medellín desde enero de 2003 hasta marzo de 2023. Con el propósito de caracterizar el comportamiento de los hurtos exhibido en los datos, se implementan tres algoritmos de agr...

Full description

Autores:
Franco Franco, Sebastián
Giraldo Martínez, Alba Julieth
Tipo de recurso:
Tesis
Fecha de publicación:
2025
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/46650
Acceso en línea:
https://hdl.handle.net/10495/46650
Palabra clave:
Aprendizaje automático no supervisado
Unsupervised Machine Learning
Análisis de datos
Data analysis
Hurto
Larceny
http://vocabularies.unesco.org/thesaurus/concept2214
https://id.nlm.nih.gov/mesh/D000069558
ODS 3: Salud y bienestar. Garantizar una vida sana y promover el bienestar de todos a todas las edades
ODS 11: Ciudades y comunidades sostenibles. Lograr que las ciudades y los asentamientos humanos sean inclusivos, seguros, resilientes y sostenibles
ODS 16: Paz, justicia e instituciones sólidas. Promover sociedades pacíficas e inclusivas para el desarrollo sostenible, facilitar el acceso a la justicia para todos y construir a todos los niveles instituciones eficaces e inclusivas que rindan cuentas
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/4.0/
Description
Summary:El presente estudio aborda los datos correspondientes a las denuncias de distintos tipos de hurtos ocurridos en la ciudad de Medellín desde enero de 2003 hasta marzo de 2023. Con el propósito de caracterizar el comportamiento de los hurtos exhibido en los datos, se implementan tres algoritmos de agrupamiento: K-Means, HDBSCAN y K-Modes. Además, se interpretan los rasgos principales de los modelos y de los grupos generados. Se encontró que, desde una perspectiva geográfica, al emplear la longitud y latitud de los puntos referidos, se obtuvieron resultados significativos. De acuerdo con el análisis realizado, el modelo HDBSCAN genera los grupos más compactos y separados. Y el modelo que permitió la mejor caracterización de los hurtos fue K-Modes que el modelo que permitió la mejor caracterización de los hurtos fue K-Modes, probado con distintos conjuntos de variables de los datos. La normalización y la reducción de dimensionalidad en los datos con cada modelo probado tienen efectos disímiles, pero suelen enriquecer las características de los grupos. En lo que respecta a los hurtos, se observó que los casos más denunciados involucran a hombres solteros de mediana edad como víctimas principales. En suma, se observó que la zona del centro urbano registra el mayor número de denuncias, mientras que los corregimientos presentan el menor número de casos.