Modelo de clasificación multiclases para la predicción de apuestas deportivas

RESUMEN : El proyecto busca crear una herramienta de clasificación multimodal que permita identificar la probabilidad de un resultado en un evento deportivo, específicamente en la Serie A de Italia tomando información de las temporadas desde 2015 y hasta lo que va de la temporada 2023. Se busca pred...

Full description

Autores:
Martínez Arias, Lina María
Marulanda Vélez, Santiago
Tipo de recurso:
Tesis
Fecha de publicación:
2023
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/35501
Acceso en línea:
https://hdl.handle.net/10495/35501
Palabra clave:
Predicciones
Técnicas de predicción
Juegos de azar
Aprendizaje automático (inteligencia artificial)
Machine learning
Análisis de datos
Data analysis
Apuestas deportivas
clasificación
http://aims.fao.org/aos/agrovoc/c_15962
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
Description
Summary:RESUMEN : El proyecto busca crear una herramienta de clasificación multimodal que permita identificar la probabilidad de un resultado en un evento deportivo, específicamente en la Serie A de Italia tomando información de las temporadas desde 2015 y hasta lo que va de la temporada 2023. Se busca predecir tres variables objetivo para los partidos utilizando la herramienta: los goles de local, los goles de visitante y el resultado del equipo local. El modelo utiliza técnicas de análisis de datos y aprendizaje automático para identificar patrones en los datos históricos de los equipos y predecir la probabilidad de cada resultado posible. El contexto de las apuestas deportivas es un sector en constante crecimiento en el que los usuarios buscan obtener beneficios a través de sus conocimientos y habilidades en deportes. El problema de negocios radica en la falta de herramientas y modelos que permitan a los usuarios tomar decisiones informadas y seguras en sus apuestas deportivas. Para abordar este problema, se ha desarrollado un modelo de apuestas deportivas que utiliza algoritmos y análisis estadísticos para predecir los resultados de los partidos de fútbol. Los datos fueron obtenidos de Understat (https://understat.com/) y se utilizan varias métricas de Machine Learning para evaluar el desempeño de los modelos de clasificación, como la exactitud (accuracy), la precisión, la tasa de verdaderos positivos (recall) y la curva característica operativa del receptor (ROC). Durante el desarrollo del proyecto, se enfrentaron algunos obstáculos relacionados con la calidad de los datos, la selección de variables y la elección de los algoritmos de aprendizaje automático más adecuados. Sin embargo, se lograron superar estos obstáculos y se obtuvo a través del modelo Hist Gradient Boosting Classifier (HGBC) una exactitud del 75%, cumpliendo con el rendimiento esperado. La realización de estos modelos se puede consultar en el repositorio de GitHub: https://github.com/lina-martinez/Modelo-clasificacion-multiclases-para-prediccion-de-apuestas-deportivas.git