Implementación del análisis estadístico en ciencias biomédicas mediante un asistente interactivo multiagente basado en modelos de lenguaje grande

El presente estudio tuvo como objetivo evaluar la implementación de un sistema multiagente interactivo basado en modelos de lenguaje grande (LLMs) para automatizar el análisis estadístico en investigaciones biomédicas, garantizando precisión, reproducibilidad y aplicabilidad práctica. Se desarrolló...

Full description

Autores:: González-Torres, Henry Joseth

Tipo de recurso:: Doctoral thesis

Fecha de publicación:: 2025

Institución:: Universidad del Valle

Repositorio:: Repositorio Digital Univalle

Idioma:: spa

Description
Summary:	El presente estudio tuvo como objetivo evaluar la implementación de un sistema multiagente interactivo basado en modelos de lenguaje grande (LLMs) para automatizar el análisis estadístico en investigaciones biomédicas, garantizando precisión, reproducibilidad y aplicabilidad práctica. Se desarrolló un asistente compuesto por siete agentes especializados —planificación, análisis, investigación contextual, generación, verificación, depuración y documentación— que colaboran de forma secuencial e iterativa con supervisión humana (Human-in-the-Loop). El diseño fue experimental in silico, utilizando datos reales y simulaciones en entorno controlado. La validación funcional se llevó a cabo mediante una escala heurística de 15 ítems aplicada por expertos sobre 30 artículos científicos, evaluando precisión técnica, claridad del código, replicabilidad y documentación. Se obtuvo una alta concordancia interevaluador (AC1 = 0.831 ± 0.075) y una puntuación promedio de 4.38 ± 0.93. Destacaron la claridad del código (4.88 ± 0.33) y la documentación generada (4.88 ± 0.33). Sin embargo, se observaron limitaciones en la identificación automática de variables (1.85 ± 0.66) y la replicación exacta de resultados (3.33 ± 0.69). En paralelo, se evaluó la aplicabilidad práctica mediante la escala System Usability Scale (SUS) aplicada a 34 usuarios, complementada con análisis semántico-emocional de sus respuestas. El puntaje mediano de usabilidad fue de 78.8 (IQR: 72.5–87.5), con predominio de emociones positivas como confianza, anticipación y satisfacción. Se concluye que el sistema multiagente mostró un desempeño funcional robusto y una buena aceptación por parte de los usuarios, posicionándose como una herramienta prometedora para fortalecer la reproducibilidad y eficiencia en el análisis estadístico aplicado a la ciencia biomédica.

Implementación del análisis estadístico en ciencias biomédicas mediante un asistente interactivo multiagente basado en modelos de lenguaje grande

Publicaciones similares