Estudio comparativo de técnicas de aprendizaje reforzado en entornos controlados

En Colombia la inteligencia artificial (IA) se ha erigido como un área de creciente interés, particularmente en dominios como el procesamiento del lenguaje natural y la visión computacional. No obstante, en este contexto, la adopción del aprendizaje por refuerzo (conocido por sus siglas en inglés co...

Full description

Autores:
Caicedo Vidal, Alvaro
Jiménez Lozano, Jorge Andrés
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad de Ibagué
Repositorio:
Repositorio Universidad de Ibagué
Idioma:
spa
OAI Identifier:
oai:repositorio.unibague.edu.co:20.500.12313/4746
Acceso en línea:
https://hdl.handle.net/20.500.12313/4746
Palabra clave:
Entornos Controlados - Técnicas de aprendizaje
Entornos Controlados - Técnicas de aprendizaje reforzado
Aprendizaje Reforzado
Reinforcement Learning
Optimización de Políticas
Policy Optimization
Proximal Policy Optimization (PPO)
Deep Deterministic Policy Gradient (DDPG)
Soft Actor-Critic (SAC)
Optimización de políticas proximales (PPO)
Gradiente de políticas determinista profundas (DDPG)
Actor-crítico blando (SAC)
Rights
openAccess
License
http://purl.org/coar/access_right/c_abf2