Estimación del tiempo de llegada de buses urbanos a la parada del usuario utilizando datos de Sri Lanka

Este proyecto propone una solución basada en inteligencia artificial para estimar el tiempo de llegada de buses urbanos a la parada del usuario, utilizando datos reales de Sri Lanka. El estudio emplea dos modelos predictivos: LightGBM y LSTM, entrenados con información GPS recolectada en la ruta 654...

Full description

Autores:
Gómez, Maria
Gómez, Giuseppe
Padilla, Juan
Tipo de recurso:
Fecha de publicación:
2025
Institución:
Universidad del Norte
Repositorio:
Repositorio Uninorte
Idioma:
spa
OAI Identifier:
oai:manglar.uninorte.edu.co:10584/13402
Acceso en línea:
http://hdl.handle.net/10584/13402
Palabra clave:
transporte público
estimación del tiempo de llegada
LightGBM
LSTM
analítica de datos
Sri Lanka
LightGBM
LSTM
data analytics
Sri Lanka
public transportation
estimated time of arrival
Rights
License
Universidad del Norte
Description
Summary:Este proyecto propone una solución basada en inteligencia artificial para estimar el tiempo de llegada de buses urbanos a la parada del usuario, utilizando datos reales de Sri Lanka. El estudio emplea dos modelos predictivos: LightGBM y LSTM, entrenados con información GPS recolectada en la ruta 654 (Kandy–Digana), la cual comprende más de 10.000 viajes. Se desarrolló un pipeline completo de analítica de datos, incluyendo limpieza, análisis exploratorio, ingeniería de características y validación, apoyado en la metodología CRISP-DM. El análisis reveló que la duración promedio de los viajes oscila entre 45 y 60 minutos, con picos de congestión en horas específicas. LightGBM logró un Error Absoluto Medio (MAE) de 32.46 segundos, superando a LSTM (MAE de 45.05 s), con mejor rendimiento especialmente en viajes de duración común. Además, se desarrolló un dashboard interactivo para visualizar predicciones, métricas clave y patrones geoespaciales. Los resultados evidencian que LightGBM es una opción más precisa y eficiente para este tipo de problemas, aunque LSTM puede ser útil cuando las dependencias temporales son críticas.