Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos

Detalhes bibliográficos
Autor(a) principal: Neves, José Marcos Miranda
Data de Publicação: 2020
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/28557
Resumo: Este trabalho apresenta uma nova abordagem para otimização de hiperparâmetros em algoritmos de Machine Learning. A ideia é construir uma surrogate através de pontos semi aleatórios gerados com o método de Sobol e então utilizar um algoritmo evolutivo (DE ou PSO neste caso) para realizar a otimização sobre ela. Também é implementado uma forma de realizar mais de uma otimização com o algoritmo evolutivo em uma mesma execução do método sem aumentar o custo computacional em relação a outros métodos de otimização. O objetivo é então verificar se a utilização dessas duas estratégias tornaria o método proposto menos propenso a ficar preso em mínimos locais e também mais consistente se comparado a outros. O foco do trabalho foi a otimização do LightGBM aplicado a classificação binária, porém é possível expandir para outras áreas fazendo as devidas adaptações. Além do método proposto, são utilizados Random Search e Bayesian Optimization para realizar a otimização do LightGBM com 3 conjuntos de dados. Os resultados obtidos mostram que a abordagem proposta com a utilização do PSO consegue ser a mais consistente dos 3 métodos, porém Bayesian Optimization ainda se sai melhor no geral.
id UTFPR-12_0f061fd5eef8262b44b1ffcdd6fcb193
oai_identifier_str oai:repositorio.utfpr.edu.br:1/28557
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-05-17T15:49:35Z2022-05-17T15:49:35Z2020-07-16NEVES, José Marcos Miranda. Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.http://repositorio.utfpr.edu.br/jspui/handle/1/28557Este trabalho apresenta uma nova abordagem para otimização de hiperparâmetros em algoritmos de Machine Learning. A ideia é construir uma surrogate através de pontos semi aleatórios gerados com o método de Sobol e então utilizar um algoritmo evolutivo (DE ou PSO neste caso) para realizar a otimização sobre ela. Também é implementado uma forma de realizar mais de uma otimização com o algoritmo evolutivo em uma mesma execução do método sem aumentar o custo computacional em relação a outros métodos de otimização. O objetivo é então verificar se a utilização dessas duas estratégias tornaria o método proposto menos propenso a ficar preso em mínimos locais e também mais consistente se comparado a outros. O foco do trabalho foi a otimização do LightGBM aplicado a classificação binária, porém é possível expandir para outras áreas fazendo as devidas adaptações. Além do método proposto, são utilizados Random Search e Bayesian Optimization para realizar a otimização do LightGBM com 3 conjuntos de dados. Os resultados obtidos mostram que a abordagem proposta com a utilização do PSO consegue ser a mais consistente dos 3 métodos, porém Bayesian Optimization ainda se sai melhor no geral.This work presents a new approach for hyperparameter optimization in Machine Learning algorithms. The idea is to build a surrogate with quasirandom numbers generated by Sobol's algorithm and then use an evolutionary algorithm (DE or PSO in this case) to perform the optimization on it. It is also implemented a way of performing more than one optimization with the evolutionary algorithm in the same execution of the method without increasing the computational cost in relation to other optimization methods. The objective is then to verify if the use of these two strategies would make the proposed method less likely to be trapped in a local minimum and also make it more consistent when compared to others. The focus of this work was the optimization of LightGBM applied to binary classification, however it is possible to expand it to other areas by making the necessary adaptations. In addition to the proposed method, Random Search and Bayesian Optimization are also used to optimize LightGBM models trained on 3 datasets. The results obtained show that the proposed approach with PSO is the most consistent of the 3 methods, however Bayesian Optimization still performs better in general.porUniversidade Tecnológica Federal do ParanáCornelio ProcopioEngenharia da ComputaçãoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado do computadorAlgoritmosOtimização matemáticaMachine learningAlgorithmsMathematical optimizationOtimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCornélio ProcópioSanches, Danilo SipoliSanches, Danilo SipoliSilva, Natássya Barlate Floro daSilva, Adrinao Rivolli daNeves, José Marcos Mirandainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALCP_DACOM_2020_1_03.pdfCP_DACOM_2020_1_03.pdfapplication/pdf5380388http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/1/CP_DACOM_2020_1_03.pdf157d106a7cf7a98f1771a258c040786eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTCP_DACOM_2020_1_03.pdf.txtCP_DACOM_2020_1_03.pdf.txtExtracted texttext/plain36http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/3/CP_DACOM_2020_1_03.pdf.txt359c989e7470416468f7ad84d3dda8c9MD53THUMBNAILCP_DACOM_2020_1_03.pdf.jpgCP_DACOM_2020_1_03.pdf.jpgGenerated Thumbnailimage/jpeg1292http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/4/CP_DACOM_2020_1_03.pdf.jpgafc5633090e4f09873cb998591c19468MD541/285572022-05-18 03:08:51.378oai:repositorio.utfpr.edu.br:1/28557TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-05-18T06:08:51Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
title Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
spellingShingle Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
Neves, José Marcos Miranda
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado do computador
Algoritmos
Otimização matemática
Machine learning
Algorithms
Mathematical optimization
title_short Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
title_full Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
title_fullStr Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
title_full_unstemmed Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
title_sort Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos
author Neves, José Marcos Miranda
author_facet Neves, José Marcos Miranda
author_role author
dc.contributor.advisor1.fl_str_mv Sanches, Danilo Sipoli
dc.contributor.referee1.fl_str_mv Sanches, Danilo Sipoli
dc.contributor.referee2.fl_str_mv Silva, Natássya Barlate Floro da
dc.contributor.referee3.fl_str_mv Silva, Adrinao Rivolli da
dc.contributor.author.fl_str_mv Neves, José Marcos Miranda
contributor_str_mv Sanches, Danilo Sipoli
Sanches, Danilo Sipoli
Silva, Natássya Barlate Floro da
Silva, Adrinao Rivolli da
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado do computador
Algoritmos
Otimização matemática
Machine learning
Algorithms
Mathematical optimization
dc.subject.por.fl_str_mv Aprendizado do computador
Algoritmos
Otimização matemática
Machine learning
Algorithms
Mathematical optimization
description Este trabalho apresenta uma nova abordagem para otimização de hiperparâmetros em algoritmos de Machine Learning. A ideia é construir uma surrogate através de pontos semi aleatórios gerados com o método de Sobol e então utilizar um algoritmo evolutivo (DE ou PSO neste caso) para realizar a otimização sobre ela. Também é implementado uma forma de realizar mais de uma otimização com o algoritmo evolutivo em uma mesma execução do método sem aumentar o custo computacional em relação a outros métodos de otimização. O objetivo é então verificar se a utilização dessas duas estratégias tornaria o método proposto menos propenso a ficar preso em mínimos locais e também mais consistente se comparado a outros. O foco do trabalho foi a otimização do LightGBM aplicado a classificação binária, porém é possível expandir para outras áreas fazendo as devidas adaptações. Além do método proposto, são utilizados Random Search e Bayesian Optimization para realizar a otimização do LightGBM com 3 conjuntos de dados. Os resultados obtidos mostram que a abordagem proposta com a utilização do PSO consegue ser a mais consistente dos 3 métodos, porém Bayesian Optimization ainda se sai melhor no geral.
publishDate 2020
dc.date.issued.fl_str_mv 2020-07-16
dc.date.accessioned.fl_str_mv 2022-05-17T15:49:35Z
dc.date.available.fl_str_mv 2022-05-17T15:49:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv NEVES, José Marcos Miranda. Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/28557
identifier_str_mv NEVES, José Marcos Miranda. Otimização de hiperparâmetros em machine learning utilizando uma surrogate e algoritmos evolutivos. 2020. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2020.
url http://repositorio.utfpr.edu.br/jspui/handle/1/28557
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.publisher.program.fl_str_mv Engenharia da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/1/CP_DACOM_2020_1_03.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/3/CP_DACOM_2020_1_03.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/28557/4/CP_DACOM_2020_1_03.pdf.jpg
bitstream.checksum.fl_str_mv 157d106a7cf7a98f1771a258c040786e
b9d82215ab23456fa2d8b49c5df1b95b
359c989e7470416468f7ad84d3dda8c9
afc5633090e4f09873cb998591c19468
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805922919059030016