Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad

El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria p...

Full description

Autores:
Bolívar Rodríguez, Valeria
Bonfante Romero, Luz Valentina
Urbina Reales, María Alejandra
Otero Gómez, Karolay Dayana
Tipo de recurso:
Fecha de publicación:
2025
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/13497
Acceso en línea:
http://hdl.handle.net/10584/13497
Palabra clave:
Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.
Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.
Rights
License
Universidad del Norte
id REPOUNORT2_c147484a2804e8d9b31a54cd45809551
oai_identifier_str oai:manglar.uninorte.edu.co:10584/13497
network_acronym_str REPOUNORT2
network_name_str Repositorio Uninorte
repository_id_str
dc.title.es_ES.fl_str_mv Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
dc.title.en_US.fl_str_mv Design of a predictive classification model for prolonged hospital stay in internal medicine at a high-complexity hospital
title Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
spellingShingle Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.
Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.
title_short Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
title_full Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
title_fullStr Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
title_full_unstemmed Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
title_sort Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidad
dc.creator.fl_str_mv Bolívar Rodríguez, Valeria
Bonfante Romero, Luz Valentina
Urbina Reales, María Alejandra
Otero Gómez, Karolay Dayana
dc.contributor.advisor.none.fl_str_mv Jubiz Díaz, María Amalia
Rivera Royero, Daniel Orlando
dc.contributor.author.none.fl_str_mv Bolívar Rodríguez, Valeria
Bonfante Romero, Luz Valentina
Urbina Reales, María Alejandra
Otero Gómez, Karolay Dayana
dc.subject.en_US.fl_str_mv Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.
topic Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.
Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.
dc.subject.es_ES.fl_str_mv Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.
description El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria prolongada desde su ingreso. El segundo es un modelo de regresión orientado a estimar la duración de la estancia en días. El proyecto partió de una revisión del problema, análisis de factores clínicos y administrativos, y la contextualización del fenómeno a nivel institucional y nacional. Se aplicó la metodología CRISP-DM, desde la comprensión del negocio y análisis de datos clínicos reales hasta la construcción, entrenamiento y validación de los modelos, utilizando aprendizaje automático con el soporte de PyCaret. En la validación, el modelo de clasificación alcanzó un 78% de exactitud, valor aceptable en contextos clínicos complejos, y el modelo de regresión obtuvo un error absoluto medio (MAE) de 2,69 días, evidenciando buena capacidad de estimación. Además, se incorporó el análisis de interpretabilidad mediante valores de Shapley (SHAP), que permitió identificar las variables más influyentes. En el modelo de regresión destacaron la razón entre días de estancia y estudios de imágenes, las interconsultas con otras especialidades y a medicina interna. En el modelo de clasificación, fueron clave la razón entre días y estudios de imágenes, la razón con procedimientos no quirúrgicos y el número de interconsultas a subespecialidades. Estos hallazgos aportan transparencia y permiten detectar posibles cuellos de botella clínicos o administrativos. Se concluye que ambos modelos pueden mejorar la identificación temprana de pacientes con riesgo de estancia prolongada y fortalecer la planificación asistencial basada en datos.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-06-13T16:04:29Z
dc.date.available.none.fl_str_mv 2025-06-13T16:04:29Z
dc.date.issued.none.fl_str_mv 2025-06-05
dc.type.es_ES.fl_str_mv article
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_6501
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/10584/13497
url http://hdl.handle.net/10584/13497
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv Universidad del Norte
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Universidad del Norte
http://purl.org/coar/access_right/c_abf2
dc.publisher.es_ES.fl_str_mv Barranquilla, Universidad del Norte, 2025
institution Universidad del Norte
bitstream.url.fl_str_mv https://manglar.uninorte.edu.co/bitstream/10584/13497/1/proyecto%20espa%c3%b1ol.png
https://manglar.uninorte.edu.co/bitstream/10584/13497/2/proyecto%20ingles.jpg
https://manglar.uninorte.edu.co/bitstream/10584/13497/3/license.txt
bitstream.checksum.fl_str_mv 03cdcfb066d98245c58a253c78c23f31
a15b9c7ad723cb0f2c4e8206114f5a9a
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital de la Universidad del Norte
repository.mail.fl_str_mv mauribe@uninorte.edu.co
_version_ 1836754008812814336
spelling Jubiz Díaz, María AmaliaRivera Royero, Daniel OrlandoBolívar Rodríguez, ValeriaBonfante Romero, Luz ValentinaUrbina Reales, María AlejandraOtero Gómez, Karolay Dayana2025-06-13T16:04:29Z2025-06-13T16:04:29Z2025-06-05http://hdl.handle.net/10584/13497El presente documento expone el desarrollo de dos modelos predictivos aplicados a pacientes del servicio de medicina interna en una institución de alta complejidad en Barranquilla, Colombia. El primero es un modelo de clasificación que busca predecir si un paciente tendrá una estancia hospitalaria prolongada desde su ingreso. El segundo es un modelo de regresión orientado a estimar la duración de la estancia en días. El proyecto partió de una revisión del problema, análisis de factores clínicos y administrativos, y la contextualización del fenómeno a nivel institucional y nacional. Se aplicó la metodología CRISP-DM, desde la comprensión del negocio y análisis de datos clínicos reales hasta la construcción, entrenamiento y validación de los modelos, utilizando aprendizaje automático con el soporte de PyCaret. En la validación, el modelo de clasificación alcanzó un 78% de exactitud, valor aceptable en contextos clínicos complejos, y el modelo de regresión obtuvo un error absoluto medio (MAE) de 2,69 días, evidenciando buena capacidad de estimación. Además, se incorporó el análisis de interpretabilidad mediante valores de Shapley (SHAP), que permitió identificar las variables más influyentes. En el modelo de regresión destacaron la razón entre días de estancia y estudios de imágenes, las interconsultas con otras especialidades y a medicina interna. En el modelo de clasificación, fueron clave la razón entre días y estudios de imágenes, la razón con procedimientos no quirúrgicos y el número de interconsultas a subespecialidades. Estos hallazgos aportan transparencia y permiten detectar posibles cuellos de botella clínicos o administrativos. Se concluye que ambos modelos pueden mejorar la identificación temprana de pacientes con riesgo de estancia prolongada y fortalecer la planificación asistencial basada en datos.This document presents the development of two predictive models applied to patients in the internal medicine department of a high-complexity institution in Barranquilla, Colombia. The first is a classification model aimed at predicting whether a patient will have a prolonged hospital stay upon admission. The second is a regression model designed to estimate the length of stay in days. The project began with a review of the problem, an analysis of clinical and administrative factors, and the contextualization of the phenomenon at both institutional and national levels. The CRISP-DM methodology was applied, from business understanding and analysis of real clinical data to the construction, training, and validation of the models, using machine learning with the support of PyCaret. During validation, the classification model achieved 78% accuracy, an acceptable value in complex clinical contexts, and the regression model obtained a mean absolute error (MAE) of 2.69 days, demonstrating good estimation capability. Additionally, interpretability analysis was incorporated using Shapley values (SHAP), which identified the most influential variables. In the regression model, the most relevant were the ratio between length of stay and imaging studies, consultations with other specialties, and with internal medicine. In the classification model, key variables included the ratio between length of stay and imaging studies, the ratio with non-surgical procedures, and the number of consultations with subspecialties. These findings contribute to transparency and help identify potential clinical or administrative bottlenecks. It is concluded that both models can improve the early identification of patients at risk of prolonged hospital stays and strengthen data-driven care planning.spaBarranquilla, Universidad del Norte, 2025Universidad del Nortehttp://purl.org/coar/access_right/c_abf2Prolonged hospital stay, internal medicine, machine learning, CRISP-DM, predictive model.Estancia hospitalaria prolongada, medicina interna, aprendizaje automático, CRISP-DM, modelo predictivo.Diseño de un modelo predictivo de clasificación para la estancia prolongada en medicina interna en un hospital de alta complejidadDesign of a predictive classification model for prolonged hospital stay in internal medicine at a high-complexity hospitalarticlehttp://purl.org/coar/resource_type/c_6501Jubiz Diaz, Maria AmaliaORIGINALproyecto español.pngproyecto español.pngimage/png2200125https://manglar.uninorte.edu.co/bitstream/10584/13497/1/proyecto%20espa%c3%b1ol.png03cdcfb066d98245c58a253c78c23f31MD51proyecto ingles.jpgproyecto ingles.jpgimage/jpeg168211https://manglar.uninorte.edu.co/bitstream/10584/13497/2/proyecto%20ingles.jpga15b9c7ad723cb0f2c4e8206114f5a9aMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://manglar.uninorte.edu.co/bitstream/10584/13497/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5310584/13497oai:manglar.uninorte.edu.co:10584/134972025-06-13 11:04:29.88Repositorio Digital de la Universidad del Nortemauribe@uninorte.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=