Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores

Detalhes bibliográficos
Autor(a) principal: Schneider, Cristian Felipe
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/179461
Resumo: A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realizadas no período 2000-2017, comparou-se o desempenho de dez classificadores, variando-se as features utilizadas, otimizando-se seus hiperparâmetros e variando-se a quantidade de partidas utilizadas. Assim, analisando-se a acurácia máxima, obteve-se valores de acurácia iguais a 54.73% ± 2.06% (Regressão Logística), 54.82% ± 2.01 (Análise Discriminante Linear), 54.35% ± 2.12% (SVM com kernel linear) e 54.34% ± 1.93% (K-Nearest Neighbors) Já um classificador ensemble composto de seis classificadores selecionados apresentou acurácia de 57% ao analisar um conjunto de dados de teste. Comparando-se com as baselines definidas: vitória do mandante (46.56% de acurácia) e time com maior ELO (50.24% de acurácia), os classificadores com melhor desempenho ultrapassaram as baselines, chegando a valores mais expressivos do que grande parte da literatura utilizada como base com relação à acurácia. No entanto, observou-se que grande parte dos classificadores apresentaram poucas ou nenhuma previsão de instâncias como sendo pertencentes à classe empate. O classificador que obteve melhor desempenho ao prever empates foi a Análise Discriminante Quadrática. Porém, o mesmo apresentou a menor acurácia dentre os classificadores observados (42.63% ± 2.33%). Desta forma, o aumento do desempenho da acurácia dos classificadores ao prever resultados de partida de futebol está diretamente conectado à necessidade de solucionar o problema relacionado com a previsão de empates.
id UFRGS-2_c83daa3c38f5ca826fcba1bce6063f71
oai_identifier_str oai:www.lume.ufrgs.br:10183/179461
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Schneider, Cristian FelipeRecamonde-Mendoza, Mariana2018-06-16T03:13:12Z2018http://hdl.handle.net/10183/179461001069033A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realizadas no período 2000-2017, comparou-se o desempenho de dez classificadores, variando-se as features utilizadas, otimizando-se seus hiperparâmetros e variando-se a quantidade de partidas utilizadas. Assim, analisando-se a acurácia máxima, obteve-se valores de acurácia iguais a 54.73% ± 2.06% (Regressão Logística), 54.82% ± 2.01 (Análise Discriminante Linear), 54.35% ± 2.12% (SVM com kernel linear) e 54.34% ± 1.93% (K-Nearest Neighbors) Já um classificador ensemble composto de seis classificadores selecionados apresentou acurácia de 57% ao analisar um conjunto de dados de teste. Comparando-se com as baselines definidas: vitória do mandante (46.56% de acurácia) e time com maior ELO (50.24% de acurácia), os classificadores com melhor desempenho ultrapassaram as baselines, chegando a valores mais expressivos do que grande parte da literatura utilizada como base com relação à acurácia. No entanto, observou-se que grande parte dos classificadores apresentaram poucas ou nenhuma previsão de instâncias como sendo pertencentes à classe empate. O classificador que obteve melhor desempenho ao prever empates foi a Análise Discriminante Quadrática. Porém, o mesmo apresentou a menor acurácia dentre os classificadores observados (42.63% ± 2.33%). Desta forma, o aumento do desempenho da acurácia dos classificadores ao prever resultados de partida de futebol está diretamente conectado à necessidade de solucionar o problema relacionado com a previsão de empates.The prediction of sport events through machine learning algorithms, especially in football, is a subject which has been in the spotlight lately, mainly because of the increase in the amount of data available and the popularity of the game. This work presents a study focused on the comparison of several classifiers when these are used to predict the result of football matches from the Premier League, an English tournament. Using data from the seasons comprised in the period of 2000-2017, a comparison between ten classifiers was made. A selection of features was conducted, allied with the optimization of the classifiers and the search for the optimal number of matches ignored at the beginning of each season. The best accuracy obtained was 54.73% ± 2.06% (Logistic Regression), 54.82% ± 2.01 (Linear Discriminant Analysis), 54.35% ± 2.12% (SVM with linear linear) and 54.34% ± 1.93% (K-Nearest Neighbors). An ensemble classifier was created using six different classifiers. The ensemble obtained 57% of accuracy when analyzing a new test data set. Comparing these results to the defined baselines (hometeam victory, with 46.56% of accuracy, and victory of the team with the biggest ELO, with 50.24% of accuracy) it was proved that the best classifiers surpassed all the baselines, scoring better than most of the related literature. It was possible to conclude that the majority of the classifiers presented few or zero predictions regarding the draw class. The classifier that better predicted draws was the Linear Discriminant Analysis. However, this classifier presented the worst accuracy among all the classifiers analysed (42.63% ± 2.33%). In this way, in order to achieve greater accuracy, it is necessary to study the problem related to draw predictions.application/pdfporEngenharia elétricaMachine learningPredictionFootballMachine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPorto Alegre, BR-RS2018Engenharia Elétricagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001069033.pdf001069033.pdfTexto completoapplication/pdf3236962http://www.lume.ufrgs.br/bitstream/10183/179461/1/001069033.pdfa7dd17cbc76ecc998a389e787270b669MD51TEXT001069033.pdf.txt001069033.pdf.txtExtracted Texttext/plain137284http://www.lume.ufrgs.br/bitstream/10183/179461/2/001069033.pdf.txtdb69096d97a2392547a33d89acc136f5MD5210183/1794612018-06-17 02:26:48.926854oai:www.lume.ufrgs.br:10183/179461Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-06-17T05:26:48Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
title Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
spellingShingle Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
Schneider, Cristian Felipe
Engenharia elétrica
Machine learning
Prediction
Football
title_short Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
title_full Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
title_fullStr Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
title_full_unstemmed Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
title_sort Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
author Schneider, Cristian Felipe
author_facet Schneider, Cristian Felipe
author_role author
dc.contributor.author.fl_str_mv Schneider, Cristian Felipe
dc.contributor.advisor1.fl_str_mv Recamonde-Mendoza, Mariana
contributor_str_mv Recamonde-Mendoza, Mariana
dc.subject.por.fl_str_mv Engenharia elétrica
topic Engenharia elétrica
Machine learning
Prediction
Football
dc.subject.eng.fl_str_mv Machine learning
Prediction
Football
description A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realizadas no período 2000-2017, comparou-se o desempenho de dez classificadores, variando-se as features utilizadas, otimizando-se seus hiperparâmetros e variando-se a quantidade de partidas utilizadas. Assim, analisando-se a acurácia máxima, obteve-se valores de acurácia iguais a 54.73% ± 2.06% (Regressão Logística), 54.82% ± 2.01 (Análise Discriminante Linear), 54.35% ± 2.12% (SVM com kernel linear) e 54.34% ± 1.93% (K-Nearest Neighbors) Já um classificador ensemble composto de seis classificadores selecionados apresentou acurácia de 57% ao analisar um conjunto de dados de teste. Comparando-se com as baselines definidas: vitória do mandante (46.56% de acurácia) e time com maior ELO (50.24% de acurácia), os classificadores com melhor desempenho ultrapassaram as baselines, chegando a valores mais expressivos do que grande parte da literatura utilizada como base com relação à acurácia. No entanto, observou-se que grande parte dos classificadores apresentaram poucas ou nenhuma previsão de instâncias como sendo pertencentes à classe empate. O classificador que obteve melhor desempenho ao prever empates foi a Análise Discriminante Quadrática. Porém, o mesmo apresentou a menor acurácia dentre os classificadores observados (42.63% ± 2.33%). Desta forma, o aumento do desempenho da acurácia dos classificadores ao prever resultados de partida de futebol está diretamente conectado à necessidade de solucionar o problema relacionado com a previsão de empates.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-06-16T03:13:12Z
dc.date.issued.fl_str_mv 2018
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/179461
dc.identifier.nrb.pt_BR.fl_str_mv 001069033
url http://hdl.handle.net/10183/179461
identifier_str_mv 001069033
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/179461/1/001069033.pdf
http://www.lume.ufrgs.br/bitstream/10183/179461/2/001069033.pdf.txt
bitstream.checksum.fl_str_mv a7dd17cbc76ecc998a389e787270b669
db69096d97a2392547a33d89acc136f5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1815447218984845312