Implementación del análisis estadístico en ciencias biomédicas mediante un asistente interactivo multiagente basado en modelos de lenguaje grande
El presente estudio tuvo como objetivo evaluar la implementación de un sistema multiagente interactivo basado en modelos de lenguaje grande (LLMs) para automatizar el análisis estadístico en investigaciones biomédicas, garantizando precisión, reproducibilidad y aplicabilidad práctica. Se desarrolló...
- Autores:
-
González-Torres, Henry Joseth
- Tipo de recurso:
- Doctoral thesis
- Fecha de publicación:
- 2025
- Institución:
- Universidad del Valle
- Repositorio:
- Repositorio Digital Univalle
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.univalle.edu.co:10893/36650
- Acceso en línea:
- https://hdl.handle.net/10893/36650
- Palabra clave:
- Investigación biomédica
Modelos de lenguaje grande LLM)
Agentes inteligentes (Programa para computador)
Reproducibilidad científica
Análisis estadístico
- Rights
- openAccess
- License
- https://creativecommons.org/licenses/by-nc-nd/4.0/
| Summary: | El presente estudio tuvo como objetivo evaluar la implementación de un sistema multiagente interactivo basado en modelos de lenguaje grande (LLMs) para automatizar el análisis estadístico en investigaciones biomédicas, garantizando precisión, reproducibilidad y aplicabilidad práctica. Se desarrolló un asistente compuesto por siete agentes especializados —planificación, análisis, investigación contextual, generación, verificación, depuración y documentación— que colaboran de forma secuencial e iterativa con supervisión humana (Human-in-the-Loop). El diseño fue experimental in silico, utilizando datos reales y simulaciones en entorno controlado. La validación funcional se llevó a cabo mediante una escala heurística de 15 ítems aplicada por expertos sobre 30 artículos científicos, evaluando precisión técnica, claridad del código, replicabilidad y documentación. Se obtuvo una alta concordancia interevaluador (AC1 = 0.831 ± 0.075) y una puntuación promedio de 4.38 ± 0.93. Destacaron la claridad del código (4.88 ± 0.33) y la documentación generada (4.88 ± 0.33). Sin embargo, se observaron limitaciones en la identificación automática de variables (1.85 ± 0.66) y la replicación exacta de resultados (3.33 ± 0.69). En paralelo, se evaluó la aplicabilidad práctica mediante la escala System Usability Scale (SUS) aplicada a 34 usuarios, complementada con análisis semántico-emocional de sus respuestas. El puntaje mediano de usabilidad fue de 78.8 (IQR: 72.5–87.5), con predominio de emociones positivas como confianza, anticipación y satisfacción. Se concluye que el sistema multiagente mostró un desempeño funcional robusto y una buena aceptación por parte de los usuarios, posicionándose como una herramienta prometedora para fortalecer la reproducibilidad y eficiencia en el análisis estadístico aplicado a la ciencia biomédica. |
|---|
