Evaluación de Algoritmos de Navegación a través de Aprendizaje por Refuerzo Profundo sobre el Vehículo Autónomo Deep Racer AWS

El presente trabajo de grado tiene como objetivo comparar algoritmos de aprendizaje por refuerzo profundo, también conocido como Deep Reinforcement Learning, en el contexto de la navegación autónoma. Se evaluaron tres algoritmos en particular: SAC (Soft Actor-Critic), PPO (Proximal Policy Optimizati...

Full description

Autores:
Gil Suarez, Andres Leonardo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Santo Tomás
Repositorio:
Repositorio Institucional USTA
Idioma:
spa
OAI Identifier:
oai:repository.usta.edu.co:11634/53207
Acceso en línea:
http://hdl.handle.net/11634/53207
Palabra clave:
Deep Reinforcement Learning
Autonomous Vehicle
Metrics
Comparison
Navigation Track
Ingeniería Electrónica
Algoritmos-Aprendizaje
Simulación Virtual
Aprendizaje por refuerzo profundo
Vehículo autónomo
Métricas
Comparación
Pista de navegación
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Description
Summary:El presente trabajo de grado tiene como objetivo comparar algoritmos de aprendizaje por refuerzo profundo, también conocido como Deep Reinforcement Learning, en el contexto de la navegación autónoma. Se evaluaron tres algoritmos en particular: SAC (Soft Actor-Critic), PPO (Proximal Policy Optimization) y una versión modificada de SAC. Las pruebas se llevaron a cabo en el vehículo autónomo Deep Racer de la empresa AWS. Para llevar a cabo la evaluación, se implementó cada algoritmo tanto en una simulación virtual como en el vehículo autónomo físico. Se realizaron múltiples pruebas en una pista de navegación estandarizada para garantizar la consistencia de los resultados. Durante estas pruebas, se recopilaron datos sobre el desempeño de cada algoritmo, incluyendo métricas como el tiempo de ejecución, la distancia recorrida y la velocidad alcanzada. Después de recopilar los datos experimentales, se realiza un análisis comparativo de los resultados obtenidos por cada algoritmo. Se evalúa su rendimiento en base a las métricas establecidas y se identifican las fortalezas y debilidades de cada uno.