Modelo de clasificación multiclases para la predicción de apuestas deportivas

RESUMEN : El proyecto busca crear una herramienta de clasificación multimodal que permita identificar la probabilidad de un resultado en un evento deportivo, específicamente en la Serie A de Italia tomando información de las temporadas desde 2015 y hasta lo que va de la temporada 2023. Se busca pred...

Full description

Autores:
Martínez Arias, Lina María
Marulanda Vélez, Santiago
Tipo de recurso:
Tesis
Fecha de publicación:
2023
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/35501
Acceso en línea:
https://hdl.handle.net/10495/35501
Palabra clave:
Predicciones
Técnicas de predicción
Juegos de azar
Aprendizaje automático (inteligencia artificial)
Machine learning
Análisis de datos
Data analysis
Apuestas deportivas
clasificación
http://aims.fao.org/aos/agrovoc/c_15962
Rights
openAccess
License
http://creativecommons.org/licenses/by-nc-sa/2.5/co/
id UDEA2_b5726a3eb5ff90b2ba894d6fcd6abba9
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/35501
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Modelo de clasificación multiclases para la predicción de apuestas deportivas
dc.title.translated.spa.fl_str_mv Modelo de clasificación para la predicción de apuestas deportivas
title Modelo de clasificación multiclases para la predicción de apuestas deportivas
spellingShingle Modelo de clasificación multiclases para la predicción de apuestas deportivas
Predicciones
Técnicas de predicción
Juegos de azar
Aprendizaje automático (inteligencia artificial)
Machine learning
Análisis de datos
Data analysis
Apuestas deportivas
clasificación
http://aims.fao.org/aos/agrovoc/c_15962
title_short Modelo de clasificación multiclases para la predicción de apuestas deportivas
title_full Modelo de clasificación multiclases para la predicción de apuestas deportivas
title_fullStr Modelo de clasificación multiclases para la predicción de apuestas deportivas
title_full_unstemmed Modelo de clasificación multiclases para la predicción de apuestas deportivas
title_sort Modelo de clasificación multiclases para la predicción de apuestas deportivas
dc.creator.fl_str_mv Martínez Arias, Lina María
Marulanda Vélez, Santiago
dc.contributor.advisor.none.fl_str_mv Botia Valderrama, Javier Fernando
dc.contributor.author.none.fl_str_mv Martínez Arias, Lina María
Marulanda Vélez, Santiago
dc.subject.lemb.none.fl_str_mv Predicciones
Técnicas de predicción
Juegos de azar
Aprendizaje automático (inteligencia artificial)
Machine learning
topic Predicciones
Técnicas de predicción
Juegos de azar
Aprendizaje automático (inteligencia artificial)
Machine learning
Análisis de datos
Data analysis
Apuestas deportivas
clasificación
http://aims.fao.org/aos/agrovoc/c_15962
dc.subject.agrovoc.none.fl_str_mv Análisis de datos
Data analysis
dc.subject.proposal.spa.fl_str_mv Apuestas deportivas
clasificación
dc.subject.agrovocuri.none.fl_str_mv http://aims.fao.org/aos/agrovoc/c_15962
description RESUMEN : El proyecto busca crear una herramienta de clasificación multimodal que permita identificar la probabilidad de un resultado en un evento deportivo, específicamente en la Serie A de Italia tomando información de las temporadas desde 2015 y hasta lo que va de la temporada 2023. Se busca predecir tres variables objetivo para los partidos utilizando la herramienta: los goles de local, los goles de visitante y el resultado del equipo local. El modelo utiliza técnicas de análisis de datos y aprendizaje automático para identificar patrones en los datos históricos de los equipos y predecir la probabilidad de cada resultado posible. El contexto de las apuestas deportivas es un sector en constante crecimiento en el que los usuarios buscan obtener beneficios a través de sus conocimientos y habilidades en deportes. El problema de negocios radica en la falta de herramientas y modelos que permitan a los usuarios tomar decisiones informadas y seguras en sus apuestas deportivas. Para abordar este problema, se ha desarrollado un modelo de apuestas deportivas que utiliza algoritmos y análisis estadísticos para predecir los resultados de los partidos de fútbol. Los datos fueron obtenidos de Understat (https://understat.com/) y se utilizan varias métricas de Machine Learning para evaluar el desempeño de los modelos de clasificación, como la exactitud (accuracy), la precisión, la tasa de verdaderos positivos (recall) y la curva característica operativa del receptor (ROC). Durante el desarrollo del proyecto, se enfrentaron algunos obstáculos relacionados con la calidad de los datos, la selección de variables y la elección de los algoritmos de aprendizaje automático más adecuados. Sin embargo, se lograron superar estos obstáculos y se obtuvo a través del modelo Hist Gradient Boosting Classifier (HGBC) una exactitud del 75%, cumpliendo con el rendimiento esperado. La realización de estos modelos se puede consultar en el repositorio de GitHub: https://github.com/lina-martinez/Modelo-clasificacion-multiclases-para-prediccion-de-apuestas-deportivas.git
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-06-14T19:53:44Z
dc.date.available.none.fl_str_mv 2023-06-14T19:53:44Z
dc.date.issued.none.fl_str_mv 2023
dc.type.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Especialización
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_46ec
dc.type.redcol.spa.fl_str_mv http://purl.org/redcol/resource_type/COther
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/other
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_46ec
status_str draft
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/10495/35501
url https://hdl.handle.net/10495/35501
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.issupplementedby.spa.fl_str_mv https://github.com/lina-martinez/Modelo-clasificacion-multiclases-para-prediccion-de-apuestas-deportivas
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/co/
https://creativecommons.org/licenses/by-nc-sa/4.0/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 40
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de Antioquia
dc.publisher.place.spa.fl_str_mv Medellín, Colombia
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería. Especialización en Analítica y Ciencia de Datos
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/d401ce52-a97f-47f9-a5e1-f0c7c5f73cf7/download
https://bibliotecadigital.udea.edu.co/bitstreams/7b7f520c-bb97-4e66-a921-4c5fc5995c64/download
https://bibliotecadigital.udea.edu.co/bitstreams/c96a5638-64c9-452e-83d9-47da8f99675f/download
https://bibliotecadigital.udea.edu.co/bitstreams/62ad0385-7b04-4216-9617-4f464e6c0ede/download
https://bibliotecadigital.udea.edu.co/bitstreams/3fd9f42f-df60-43e1-ab28-d32c3e2efcfe/download
bitstream.checksum.fl_str_mv e2060682c9c70d4d30c83c51448f4eed
6daf3cb091133ef41f5da9649dac56e5
8a4605be74aa9ea9d79846c1fba20a33
8605457df65522aac6922638dc6756b6
660b6829cef7b525df03931f5e99449a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052342417293312
spelling Botia Valderrama, Javier FernandoMartínez Arias, Lina MaríaMarulanda Vélez, Santiago2023-06-14T19:53:44Z2023-06-14T19:53:44Z2023https://hdl.handle.net/10495/35501RESUMEN : El proyecto busca crear una herramienta de clasificación multimodal que permita identificar la probabilidad de un resultado en un evento deportivo, específicamente en la Serie A de Italia tomando información de las temporadas desde 2015 y hasta lo que va de la temporada 2023. Se busca predecir tres variables objetivo para los partidos utilizando la herramienta: los goles de local, los goles de visitante y el resultado del equipo local. El modelo utiliza técnicas de análisis de datos y aprendizaje automático para identificar patrones en los datos históricos de los equipos y predecir la probabilidad de cada resultado posible. El contexto de las apuestas deportivas es un sector en constante crecimiento en el que los usuarios buscan obtener beneficios a través de sus conocimientos y habilidades en deportes. El problema de negocios radica en la falta de herramientas y modelos que permitan a los usuarios tomar decisiones informadas y seguras en sus apuestas deportivas. Para abordar este problema, se ha desarrollado un modelo de apuestas deportivas que utiliza algoritmos y análisis estadísticos para predecir los resultados de los partidos de fútbol. Los datos fueron obtenidos de Understat (https://understat.com/) y se utilizan varias métricas de Machine Learning para evaluar el desempeño de los modelos de clasificación, como la exactitud (accuracy), la precisión, la tasa de verdaderos positivos (recall) y la curva característica operativa del receptor (ROC). Durante el desarrollo del proyecto, se enfrentaron algunos obstáculos relacionados con la calidad de los datos, la selección de variables y la elección de los algoritmos de aprendizaje automático más adecuados. Sin embargo, se lograron superar estos obstáculos y se obtuvo a través del modelo Hist Gradient Boosting Classifier (HGBC) una exactitud del 75%, cumpliendo con el rendimiento esperado. La realización de estos modelos se puede consultar en el repositorio de GitHub: https://github.com/lina-martinez/Modelo-clasificacion-multiclases-para-prediccion-de-apuestas-deportivas.gitABSTRACT : The project proposes to create a multimodal classification tool that allows to identify the probability of a result in a sporting event, specifically in the Italian Serie A for the seasons from 2015 and until the 2023 season. Three objective variables are to be predicted for matches using the tool: home goals, away goals, and home team result. The model uses data analysis and machine learning techniques to identify patterns in historical team data and predict the probability of each possible outcome. The context of sports betting is an ever-growing sector where users seek to profit from their knowledge and skills in sports. The business problem lies in the lack of tools and models that allow users to make informed and safe decisions in their sports betting. To address this problem, a sports betting model has been developed that uses algorithms and statistical analysis to predict the outcome of football matches. The data was obtained from Understat (https://understat.com/) and several machine learning metrics are used to evaluate the performance of the classification models, such as accuracy, precision, true positive rate (recall) and the receiver operating characteristic (ROC) curve. During the development of the project, there were some obstacles related to the quality of the data, the selection of the variables and the choice of the most appropriate machine learning algorithms. However, these obstacles were overcome and an accuracy of 75% was obtained using the Hist Gradient Boosting Classifier (HGBC) model, in line with the expected performance. The implementation of these models can be consulted in the GitHub repository: https://github.com/lina-martinez/Modelo-clasificacion-multiclases-para-prediccion-de-apuestas-deportivas.gitEspecializaciónEspecialista en Analítica y Ciencia de Datos40application/pdfspaUniversidad de AntioquiaMedellín, ColombiaFacultad de Ingeniería. Especialización en Analítica y Ciencia de Datoshttp://creativecommons.org/licenses/by-nc-sa/2.5/co/https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Modelo de clasificación multiclases para la predicción de apuestas deportivasModelo de clasificación para la predicción de apuestas deportivasTesis/Trabajo de grado - Monografía - Especializaciónhttp://purl.org/coar/resource_type/c_46echttp://purl.org/redcol/resource_type/COtherhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/draftPrediccionesTécnicas de predicciónJuegos de azarAprendizaje automático (inteligencia artificial)Machine learningAnálisis de datosData analysisApuestas deportivasclasificaciónhttp://aims.fao.org/aos/agrovoc/c_15962https://github.com/lina-martinez/Modelo-clasificacion-multiclases-para-prediccion-de-apuestas-deportivasPublicationCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81051https://bibliotecadigital.udea.edu.co/bitstreams/d401ce52-a97f-47f9-a5e1-f0c7c5f73cf7/downloade2060682c9c70d4d30c83c51448f4eedMD53falseAnonymousREADORIGINALMartinezLina_MarulandaSantiago_2023_ModeloApuestasDeportivas.pdfMartinezLina_MarulandaSantiago_2023_ModeloApuestasDeportivas.pdfTrabajo de grado de especializaciónapplication/pdf604393https://bibliotecadigital.udea.edu.co/bitstreams/7b7f520c-bb97-4e66-a921-4c5fc5995c64/download6daf3cb091133ef41f5da9649dac56e5MD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/c96a5638-64c9-452e-83d9-47da8f99675f/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTEXTMartinezLina_MarulandaSantiago_2023_ModeloApuestasDeportivas.pdf.txtMartinezLina_MarulandaSantiago_2023_ModeloApuestasDeportivas.pdf.txtExtracted texttext/plain63365https://bibliotecadigital.udea.edu.co/bitstreams/62ad0385-7b04-4216-9617-4f464e6c0ede/download8605457df65522aac6922638dc6756b6MD55falseAnonymousREADTHUMBNAILMartinezLina_MarulandaSantiago_2023_ModeloApuestasDeportivas.pdf.jpgMartinezLina_MarulandaSantiago_2023_ModeloApuestasDeportivas.pdf.jpgGenerated Thumbnailimage/jpeg7000https://bibliotecadigital.udea.edu.co/bitstreams/3fd9f42f-df60-43e1-ab28-d32c3e2efcfe/download660b6829cef7b525df03931f5e99449aMD56falseAnonymousREAD10495/35501oai:bibliotecadigital.udea.edu.co:10495/355012025-03-26 20:52:46.204http://creativecommons.org/licenses/by-nc-sa/2.5/co/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=