Estrategia computacional para estimar la posibilidad de una persona tener diabetes a partir de datos de historiales médicos, utilizando algoritmos de machine learning
El presente trabajo de grado tiene como propósito desarrollar una estrategia computacional apoyada en algoritmos de Machine Learning, con el fin de estimar la posibilidad de que una persona tenga un diagnostico de diabetes, a partir del análisis de variables clínicas y antecedentes médicos. Para ell...
- Autores:
-
Camargo Ríos, José Alejandro
Oviedo Pérez, Luis Alfonso
Trujillo Carrillo, Lizeth Valentina
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2025
- Institución:
- Corporación Universitaria Remington
- Repositorio:
- Repositorio institucional Uniremington
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.uniremington.edu.co:123456789/7573
- Acceso en línea:
- https://repositorio.uniremington.edu.co/handle/123456789/7573
- Palabra clave:
- Machine learning
Predicción de diabetes
Análisis de datos médicos
Regresión
Detección
Aprendizaje automático (Inteligencia artificial)
Diabetes mellitus
Diagnóstico
- Rights
- openAccess
- License
- Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
| Summary: | El presente trabajo de grado tiene como propósito desarrollar una estrategia computacional apoyada en algoritmos de Machine Learning, con el fin de estimar la posibilidad de que una persona tenga un diagnostico de diabetes, a partir del análisis de variables clínicas y antecedentes médicos. Para ello, se utilizará un conjunto de datos reales compuesto por 100.000 registros de historiales médicos, que incluyen información como la edad, género, presencia de hipertensión, problemas cardíacos, historial de tabaquismo, índice de masa corporal, niveles de hemoglobina glicosilada (HbA1c) y glucosa en sangre, así como el diagnóstico correspondiente. La metodología del estudio inicia con un análisis exploratorio de los datos mediante herramientas estadísticas y visuales, como tablas de frecuencia, diagramas de caja y bigotes, gráficos circulares y mapas de correlación. Esta etapa permitirá identificar tendencias, relaciones entre variables y posibles valores atípicos, con el objetivo de preparar adecuadamente los datos para su uso en modelos predictivos. Posteriormente, se implementarán diferentes modelos de clasificación, con el fin de comparar su precisión, sensibilidad y especificidad. El modelo o los modelos con mejor desempeño será seleccionado como base para el desarrollo de una herramienta computacional que permita ingresar nuevos datos individuales y obtener una predicción binaria: “diabético” o “no diabético”. |
|---|
