Implementación del análisis estadístico en ciencias biomédicas mediante un asistente interactivo multiagente basado en modelos de lenguaje grande

El presente estudio tuvo como objetivo evaluar la implementación de un sistema multiagente interactivo basado en modelos de lenguaje grande (LLMs) para automatizar el análisis estadístico en investigaciones biomédicas, garantizando precisión, reproducibilidad y aplicabilidad práctica. Se desarrolló...

Full description

Autores:
González-Torres, Henry Joseth
Tipo de recurso:
Doctoral thesis
Fecha de publicación:
2025
Institución:
Universidad del Valle
Repositorio:
Repositorio Digital Univalle
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.univalle.edu.co:10893/36650
Acceso en línea:
https://hdl.handle.net/10893/36650
Palabra clave:
Investigación biomédica
Modelos de lenguaje grande LLM)
Agentes inteligentes (Programa para computador)
Reproducibilidad científica
Análisis estadístico
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc-nd/4.0/
Description
Summary:El presente estudio tuvo como objetivo evaluar la implementación de un sistema multiagente interactivo basado en modelos de lenguaje grande (LLMs) para automatizar el análisis estadístico en investigaciones biomédicas, garantizando precisión, reproducibilidad y aplicabilidad práctica. Se desarrolló un asistente compuesto por siete agentes especializados —planificación, análisis, investigación contextual, generación, verificación, depuración y documentación— que colaboran de forma secuencial e iterativa con supervisión humana (Human-in-the-Loop). El diseño fue experimental in silico, utilizando datos reales y simulaciones en entorno controlado. La validación funcional se llevó a cabo mediante una escala heurística de 15 ítems aplicada por expertos sobre 30 artículos científicos, evaluando precisión técnica, claridad del código, replicabilidad y documentación. Se obtuvo una alta concordancia interevaluador (AC1 = 0.831 ± 0.075) y una puntuación promedio de 4.38 ± 0.93. Destacaron la claridad del código (4.88 ± 0.33) y la documentación generada (4.88 ± 0.33). Sin embargo, se observaron limitaciones en la identificación automática de variables (1.85 ± 0.66) y la replicación exacta de resultados (3.33 ± 0.69). En paralelo, se evaluó la aplicabilidad práctica mediante la escala System Usability Scale (SUS) aplicada a 34 usuarios, complementada con análisis semántico-emocional de sus respuestas. El puntaje mediano de usabilidad fue de 78.8 (IQR: 72.5–87.5), con predominio de emociones positivas como confianza, anticipación y satisfacción. Se concluye que el sistema multiagente mostró un desempeño funcional robusto y una buena aceptación por parte de los usuarios, posicionándose como una herramienta prometedora para fortalecer la reproducibilidad y eficiencia en el análisis estadístico aplicado a la ciencia biomédica.