Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/179461 |
Resumo: | A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realizadas no período 2000-2017, comparou-se o desempenho de dez classificadores, variando-se as features utilizadas, otimizando-se seus hiperparâmetros e variando-se a quantidade de partidas utilizadas. Assim, analisando-se a acurácia máxima, obteve-se valores de acurácia iguais a 54.73% ± 2.06% (Regressão Logística), 54.82% ± 2.01 (Análise Discriminante Linear), 54.35% ± 2.12% (SVM com kernel linear) e 54.34% ± 1.93% (K-Nearest Neighbors) Já um classificador ensemble composto de seis classificadores selecionados apresentou acurácia de 57% ao analisar um conjunto de dados de teste. Comparando-se com as baselines definidas: vitória do mandante (46.56% de acurácia) e time com maior ELO (50.24% de acurácia), os classificadores com melhor desempenho ultrapassaram as baselines, chegando a valores mais expressivos do que grande parte da literatura utilizada como base com relação à acurácia. No entanto, observou-se que grande parte dos classificadores apresentaram poucas ou nenhuma previsão de instâncias como sendo pertencentes à classe empate. O classificador que obteve melhor desempenho ao prever empates foi a Análise Discriminante Quadrática. Porém, o mesmo apresentou a menor acurácia dentre os classificadores observados (42.63% ± 2.33%). Desta forma, o aumento do desempenho da acurácia dos classificadores ao prever resultados de partida de futebol está diretamente conectado à necessidade de solucionar o problema relacionado com a previsão de empates. |
id |
UFRGS-2_c83daa3c38f5ca826fcba1bce6063f71 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/179461 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Schneider, Cristian FelipeRecamonde-Mendoza, Mariana2018-06-16T03:13:12Z2018http://hdl.handle.net/10183/179461001069033A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realizadas no período 2000-2017, comparou-se o desempenho de dez classificadores, variando-se as features utilizadas, otimizando-se seus hiperparâmetros e variando-se a quantidade de partidas utilizadas. Assim, analisando-se a acurácia máxima, obteve-se valores de acurácia iguais a 54.73% ± 2.06% (Regressão Logística), 54.82% ± 2.01 (Análise Discriminante Linear), 54.35% ± 2.12% (SVM com kernel linear) e 54.34% ± 1.93% (K-Nearest Neighbors) Já um classificador ensemble composto de seis classificadores selecionados apresentou acurácia de 57% ao analisar um conjunto de dados de teste. Comparando-se com as baselines definidas: vitória do mandante (46.56% de acurácia) e time com maior ELO (50.24% de acurácia), os classificadores com melhor desempenho ultrapassaram as baselines, chegando a valores mais expressivos do que grande parte da literatura utilizada como base com relação à acurácia. No entanto, observou-se que grande parte dos classificadores apresentaram poucas ou nenhuma previsão de instâncias como sendo pertencentes à classe empate. O classificador que obteve melhor desempenho ao prever empates foi a Análise Discriminante Quadrática. Porém, o mesmo apresentou a menor acurácia dentre os classificadores observados (42.63% ± 2.33%). Desta forma, o aumento do desempenho da acurácia dos classificadores ao prever resultados de partida de futebol está diretamente conectado à necessidade de solucionar o problema relacionado com a previsão de empates.The prediction of sport events through machine learning algorithms, especially in football, is a subject which has been in the spotlight lately, mainly because of the increase in the amount of data available and the popularity of the game. This work presents a study focused on the comparison of several classifiers when these are used to predict the result of football matches from the Premier League, an English tournament. Using data from the seasons comprised in the period of 2000-2017, a comparison between ten classifiers was made. A selection of features was conducted, allied with the optimization of the classifiers and the search for the optimal number of matches ignored at the beginning of each season. The best accuracy obtained was 54.73% ± 2.06% (Logistic Regression), 54.82% ± 2.01 (Linear Discriminant Analysis), 54.35% ± 2.12% (SVM with linear linear) and 54.34% ± 1.93% (K-Nearest Neighbors). An ensemble classifier was created using six different classifiers. The ensemble obtained 57% of accuracy when analyzing a new test data set. Comparing these results to the defined baselines (hometeam victory, with 46.56% of accuracy, and victory of the team with the biggest ELO, with 50.24% of accuracy) it was proved that the best classifiers surpassed all the baselines, scoring better than most of the related literature. It was possible to conclude that the majority of the classifiers presented few or zero predictions regarding the draw class. The classifier that better predicted draws was the Linear Discriminant Analysis. However, this classifier presented the worst accuracy among all the classifiers analysed (42.63% ± 2.33%). In this way, in order to achieve greater accuracy, it is necessary to study the problem related to draw predictions.application/pdfporEngenharia elétricaMachine learningPredictionFootballMachine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPorto Alegre, BR-RS2018Engenharia Elétricagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001069033.pdf001069033.pdfTexto completoapplication/pdf3236962http://www.lume.ufrgs.br/bitstream/10183/179461/1/001069033.pdfa7dd17cbc76ecc998a389e787270b669MD51TEXT001069033.pdf.txt001069033.pdf.txtExtracted Texttext/plain137284http://www.lume.ufrgs.br/bitstream/10183/179461/2/001069033.pdf.txtdb69096d97a2392547a33d89acc136f5MD5210183/1794612018-06-17 02:26:48.926854oai:www.lume.ufrgs.br:10183/179461Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2018-06-17T05:26:48Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores |
title |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores |
spellingShingle |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores Schneider, Cristian Felipe Engenharia elétrica Machine learning Prediction Football |
title_short |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores |
title_full |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores |
title_fullStr |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores |
title_full_unstemmed |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores |
title_sort |
Machine learning aplicado na previsão de resultados de partidas de futebol : um estudo de caso para comparação de diferentes classificadores |
author |
Schneider, Cristian Felipe |
author_facet |
Schneider, Cristian Felipe |
author_role |
author |
dc.contributor.author.fl_str_mv |
Schneider, Cristian Felipe |
dc.contributor.advisor1.fl_str_mv |
Recamonde-Mendoza, Mariana |
contributor_str_mv |
Recamonde-Mendoza, Mariana |
dc.subject.por.fl_str_mv |
Engenharia elétrica |
topic |
Engenharia elétrica Machine learning Prediction Football |
dc.subject.eng.fl_str_mv |
Machine learning Prediction Football |
description |
A previsão de eventos esportivos, em especial o futebol, através da utilização de algoritmos de machine learning é uma área de pesquisa que vem ganhando destaque, em parte devido à grande popularidade do esporte e o aumento da quantidade de dados disponíveis. O presente trabalho apresenta um estudo do desempenho de diferentes classificadores quando os mesmos são utilizados para prever o resultado de partidas de futebol do campeonato Premier League. A partir de dados que retratam partidas realizadas no período 2000-2017, comparou-se o desempenho de dez classificadores, variando-se as features utilizadas, otimizando-se seus hiperparâmetros e variando-se a quantidade de partidas utilizadas. Assim, analisando-se a acurácia máxima, obteve-se valores de acurácia iguais a 54.73% ± 2.06% (Regressão Logística), 54.82% ± 2.01 (Análise Discriminante Linear), 54.35% ± 2.12% (SVM com kernel linear) e 54.34% ± 1.93% (K-Nearest Neighbors) Já um classificador ensemble composto de seis classificadores selecionados apresentou acurácia de 57% ao analisar um conjunto de dados de teste. Comparando-se com as baselines definidas: vitória do mandante (46.56% de acurácia) e time com maior ELO (50.24% de acurácia), os classificadores com melhor desempenho ultrapassaram as baselines, chegando a valores mais expressivos do que grande parte da literatura utilizada como base com relação à acurácia. No entanto, observou-se que grande parte dos classificadores apresentaram poucas ou nenhuma previsão de instâncias como sendo pertencentes à classe empate. O classificador que obteve melhor desempenho ao prever empates foi a Análise Discriminante Quadrática. Porém, o mesmo apresentou a menor acurácia dentre os classificadores observados (42.63% ± 2.33%). Desta forma, o aumento do desempenho da acurácia dos classificadores ao prever resultados de partida de futebol está diretamente conectado à necessidade de solucionar o problema relacionado com a previsão de empates. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-06-16T03:13:12Z |
dc.date.issued.fl_str_mv |
2018 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/179461 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001069033 |
url |
http://hdl.handle.net/10183/179461 |
identifier_str_mv |
001069033 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/179461/1/001069033.pdf http://www.lume.ufrgs.br/bitstream/10183/179461/2/001069033.pdf.txt |
bitstream.checksum.fl_str_mv |
a7dd17cbc76ecc998a389e787270b669 db69096d97a2392547a33d89acc136f5 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447218984845312 |