Estrategia computacional para estimar la posibilidad de una persona tener diabetes a partir de datos de historiales médicos, utilizando algoritmos de machine learning

El presente trabajo de grado tiene como propósito desarrollar una estrategia computacional apoyada en algoritmos de Machine Learning, con el fin de estimar la posibilidad de que una persona tenga un diagnostico de diabetes, a partir del análisis de variables clínicas y antecedentes médicos. Para ell...

Full description

Autores:
Camargo Ríos, José Alejandro
Oviedo Pérez, Luis Alfonso
Trujillo Carrillo, Lizeth Valentina
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Corporación Universitaria Remington
Repositorio:
Repositorio institucional Uniremington
Idioma:
spa
OAI Identifier:
oai:repositorio.uniremington.edu.co:123456789/7573
Acceso en línea:
https://repositorio.uniremington.edu.co/handle/123456789/7573
Palabra clave:
Machine learning
Predicción de diabetes
Análisis de datos médicos
Regresión
Detección
Aprendizaje automático (Inteligencia artificial)
Diabetes mellitus
Diagnóstico
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Description
Summary:El presente trabajo de grado tiene como propósito desarrollar una estrategia computacional apoyada en algoritmos de Machine Learning, con el fin de estimar la posibilidad de que una persona tenga un diagnostico de diabetes, a partir del análisis de variables clínicas y antecedentes médicos. Para ello, se utilizará un conjunto de datos reales compuesto por 100.000 registros de historiales médicos, que incluyen información como la edad, género, presencia de hipertensión, problemas cardíacos, historial de tabaquismo, índice de masa corporal, niveles de hemoglobina glicosilada (HbA1c) y glucosa en sangre, así como el diagnóstico correspondiente. La metodología del estudio inicia con un análisis exploratorio de los datos mediante herramientas estadísticas y visuales, como tablas de frecuencia, diagramas de caja y bigotes, gráficos circulares y mapas de correlación. Esta etapa permitirá identificar tendencias, relaciones entre variables y posibles valores atípicos, con el objetivo de preparar adecuadamente los datos para su uso en modelos predictivos. Posteriormente, se implementarán diferentes modelos de clasificación, con el fin de comparar su precisión, sensibilidad y especificidad. El modelo o los modelos con mejor desempeño será seleccionado como base para el desarrollo de una herramienta computacional que permita ingresar nuevos datos individuales y obtener una predicción binaria: “diabético” o “no diabético”.