Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria p...
- Autores:
-
Bolívar Rodríguez, Valeria
Bonfante Romero, Luz Valentina
Urbina Reales, María Alejandra
Otero Gómez, Karolay Dayana
- Tipo de recurso:
- Fecha de publicación:
- 2025
- Institución:
- Universidad del Norte
- Repositorio:
- Repositorio Uninorte
- Idioma:
- spa
- OAI Identifier:
- oai:manglar.uninorte.edu.co:10584/13497
- Acceso en línea:
- http://hdl.handle.net/10584/13497
- Palabra clave:
- Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.
Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.
- Rights
- License
- Universidad del Norte
id |
REPOUNORT2_c147484a2804e8d9b31a54cd45809551 |
---|---|
oai_identifier_str |
oai:manglar.uninorte.edu.co:10584/13497 |
network_acronym_str |
REPOUNORT2 |
network_name_str |
Repositorio Uninorte |
repository_id_str |
|
dc.title.es_ES.fl_str_mv |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad |
dc.title.en_US.fl_str_mv |
Design of a predictive classification model for prolonged hospital stay in internal medicine at a high-complexity hospital |
title |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad |
spellingShingle |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model. Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo. |
title_short |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad |
title_full |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad |
title_fullStr |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad |
title_full_unstemmed |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad |
title_sort |
Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad |
dc.creator.fl_str_mv |
Bolívar Rodríguez, Valeria Bonfante Romero, Luz Valentina Urbina Reales, María Alejandra Otero Gómez, Karolay Dayana |
dc.contributor.advisor.none.fl_str_mv |
Jubiz Díaz, María Amalia Rivera Royero, Daniel Orlando |
dc.contributor.author.none.fl_str_mv |
Bolívar Rodríguez, Valeria Bonfante Romero, Luz Valentina Urbina Reales, María Alejandra Otero Gómez, Karolay Dayana |
dc.subject.en_US.fl_str_mv |
Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model. |
topic |
Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model. Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo. |
dc.subject.es_ES.fl_str_mv |
Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo. |
description |
El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria prolongada desde su ingreso. El segundo es un modelo de regresión orientado a estimar la duración de la estancia en días. El proyecto partió de una revisión del problema, análisis de factores clínicos y administrativos, y la contextualización del fenómeno a nivel institucional y nacional. Se aplicó la metodología CRISP-DM, desde la comprensión del negocio y análisis de datos clínicos reales hasta la construcción, entrenamiento y validación de los modelos, utilizando aprendizaje automático con el soporte de PyCaret. En la validación, el modelo de clasificación alcanzó un 78% de exactitud, valor aceptable en contextos clínicos complejos, y el modelo de regresión obtuvo un error absoluto medio (MAE) de 2,69 días, evidenciando buena capacidad de estimación. Además, se incorporó el análisis de interpretabilidad mediante valores de Shapley (SHAP), que permitió identificar las variables más influyentes. En el modelo de regresión destacaron la razón entre días de estancia y estudios de imágenes, las interconsultas con otras especialidades y a medicina interna. En el modelo de clasificación, fueron clave la razón entre días y estudios de imágenes, la razón con procedimientos no quirúrgicos y el número de interconsultas a subespecialidades. Estos hallazgos aportan transparencia y permiten detectar posibles cuellos de botella clínicos o administrativos. Se concluye que ambos modelos pueden mejorar la identificación temprana de pacientes con riesgo de estancia prolongada y fortalecer la planificación asistencial basada en datos. |
publishDate |
2025 |
dc.date.accessioned.none.fl_str_mv |
2025-06-13T16:04:29Z |
dc.date.available.none.fl_str_mv |
2025-06-13T16:04:29Z |
dc.date.issued.none.fl_str_mv |
2025-06-05 |
dc.type.es_ES.fl_str_mv |
article |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/10584/13497 |
url |
http://hdl.handle.net/10584/13497 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
Universidad del Norte |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Universidad del Norte http://purl.org/coar/access_right/c_abf2 |
dc.publisher.es_ES.fl_str_mv |
Barranquilla, Universidad del Norte, 2025 |
institution |
Universidad del Norte |
bitstream.url.fl_str_mv |
https://manglar.uninorte.edu.co/bitstream/10584/13497/1/proyecto%20espa%c3%b1ol.png https://manglar.uninorte.edu.co/bitstream/10584/13497/2/proyecto%20ingles.jpg https://manglar.uninorte.edu.co/bitstream/10584/13497/3/license.txt |
bitstream.checksum.fl_str_mv |
03cdcfb066d98245c58a253c78c23f31 a15b9c7ad723cb0f2c4e8206114f5a9a 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Digital de la Universidad del Norte |
repository.mail.fl_str_mv |
mauribe@uninorte.edu.co |
_version_ |
1836754008812814336 |
spelling |
Jubiz Díaz, María AmaliaRivera Royero, Daniel OrlandoBolívar Rodríguez, ValeriaBonfante Romero, Luz ValentinaUrbina Reales, María AlejandraOtero Gómez, Karolay Dayana2025-06-13T16:04:29Z2025-06-13T16:04:29Z2025-06-05http://hdl.handle.net/10584/13497El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria prolongada desde su ingreso. El segundo es un modelo de regresión orientado a estimar la duración de la estancia en días. El proyecto partió de una revisión del problema, análisis de factores clínicos y administrativos, y la contextualización del fenómeno a nivel institucional y nacional. Se aplicó la metodología CRISP-DM, desde la comprensión del negocio y análisis de datos clínicos reales hasta la construcción, entrenamiento y validación de los modelos, utilizando aprendizaje automático con el soporte de PyCaret. En la validación, el modelo de clasificación alcanzó un 78% de exactitud, valor aceptable en contextos clínicos complejos, y el modelo de regresión obtuvo un error absoluto medio (MAE) de 2,69 días, evidenciando buena capacidad de estimación. Además, se incorporó el análisis de interpretabilidad mediante valores de Shapley (SHAP), que permitió identificar las variables más influyentes. En el modelo de regresión destacaron la razón entre días de estancia y estudios de imágenes, las interconsultas con otras especialidades y a medicina interna. En el modelo de clasificación, fueron clave la razón entre días y estudios de imágenes, la razón con procedimientos no quirúrgicos y el número de interconsultas a subespecialidades. Estos hallazgos aportan transparencia y permiten detectar posibles cuellos de botella clínicos o administrativos. Se concluye que ambos modelos pueden mejorar la identificación temprana de pacientes con riesgo de estancia prolongada y fortalecer la planificación asistencial basada en datos.This document presents the development of two predictive models applied to patients in the internal medicine department of a high-complexity institution in Barranquilla, Colombia. The first is a classification model aimed at predicting whether a patient will have a prolonged hospital stay upon admission. The second is a regression model designed to estimate the length of stay in days. The project began with a review of the problem, an analysis of clinical and administrative factors, and the contextualization of the phenomenon at both institutional and national levels. The CRISP-DM methodology was applied, from business understanding and analysis of real clinical data to the construction, training, and validation of the models, using machine learning with the support of PyCaret. During validation, the classification model achieved 78% accuracy, an acceptable value in complex clinical contexts, and the regression model obtained a mean absolute error (MAE) of 2.69 days, demonstrating good estimation capability. Additionally, interpretability analysis was incorporated using Shapley values (SHAP), which identified the most influential variables. In the regression model, the most relevant were the ratio between length of stay and imaging studies, consultations with other specialties, and with internal medicine. In the classification model, key variables included the ratio between length of stay and imaging studies, the ratio with non-surgical procedures, and the number of consultations with subspecialties. These findings contribute to transparency and help identify potential clinical or administrative bottlenecks. It is concluded that both models can improve the early identification of patients at risk of prolonged hospital stays and strengthen data-driven care planning.spaBarranquilla, Universidad del Norte, 2025Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidadDesign of a predictive classification model for prolonged hospital stay in internal medicine at a high-complexity hospitalarticlehttp://purl.org/coar/resource_type/c_6501Jubiz Diaz, Maria AmaliaORIGINALproyecto español.pngproyecto español.pngimage/png2200125https://manglar.uninorte.edu.co/bitstream/10584/13497/1/proyecto%20espa%c3%b1ol.png03cdcfb066d98245c58a253c78c23f31MD51proyecto ingles.jpgproyecto ingles.jpgimage/jpeg168211https://manglar.uninorte.edu.co/bitstream/10584/13497/2/proyecto%20ingles.jpga15b9c7ad723cb0f2c4e8206114f5a9aMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/13497/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310584/13497oai:manglar.uninorte.edu.co:10584/134972025-06-13 11:04:29.88Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |