Meta-learning for classifier ensemble optimization

Detalhes bibliográficos
Autor(a) principal: Schmitz, Christian
Data de Publicação: 2024
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/277571
Resumo: À medida que o aprendizado de máquina se torna mais popular, é natural que profissionais de outras áreas e que não são especialistas queiram aproveitá-lo em suas tarefas. No entanto, selecionar um algoritmo e ajustá-lo para que funcione bem em uma determinada tarefa é complexo e requer conhecimento técnico em aprendizado de máquina, que os profissionais de outros domínios em geral não possuem. Esse problema fica ainda mais evidente quando são usados ensembles, pois o número de algoritmos a serem escolhidos e de hiperparâmetros a serem ajustados aumenta significativamente. Os ensembles são particularmente úteis em tarefas complexas que envolvem desafios como desequilíbrio de classe ou alta dimensionalidade, que são frequentemente encontrados em tarefas específicas de domínio. Assim, o desenvolvimento de mecanismos que ajudem o usuário não técnico a escolher e ajustar um modelo de ensembles para se resolver uma tarefa é de grande relevância na área de aprendizado de máquina. Nesta tese, é apresentado um novo framework chamado Meta-CLEO, que usa o meta-aprendizado para criar ensembles para novas tarefas relacionando-as com tarefas aprendidas anteriormente, aproveitando ensembles de classificadores que funcionaram bem em tarefas semelhantes no passado. Métricas de diversidade específicas de ensembles também são usadas para proporcionar maior generalização. Os experimentos realizados com 74 tarefas avaliaram diferentes algoritmos de ranqueamento de ensembles com base no desempenho do ensemble e nas métricas de diversidade e compararam os resultados do Meta-CLEO com dois baselines, Random Forest e AdaBoost. Os resultados mostram que o Meta-CLEO é equivalente ou tem desempenho superior aos baselines em mais de 75% das tarefas avaliadas.
id URGS_e7a91b77b97e4a6e2ab3a088da62d851
oai_identifier_str oai:www.lume.ufrgs.br:10183/277571
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Schmitz, ChristianGalante, Renata de Matos2024-08-23T06:29:51Z2024http://hdl.handle.net/10183/277571001209361À medida que o aprendizado de máquina se torna mais popular, é natural que profissionais de outras áreas e que não são especialistas queiram aproveitá-lo em suas tarefas. No entanto, selecionar um algoritmo e ajustá-lo para que funcione bem em uma determinada tarefa é complexo e requer conhecimento técnico em aprendizado de máquina, que os profissionais de outros domínios em geral não possuem. Esse problema fica ainda mais evidente quando são usados ensembles, pois o número de algoritmos a serem escolhidos e de hiperparâmetros a serem ajustados aumenta significativamente. Os ensembles são particularmente úteis em tarefas complexas que envolvem desafios como desequilíbrio de classe ou alta dimensionalidade, que são frequentemente encontrados em tarefas específicas de domínio. Assim, o desenvolvimento de mecanismos que ajudem o usuário não técnico a escolher e ajustar um modelo de ensembles para se resolver uma tarefa é de grande relevância na área de aprendizado de máquina. Nesta tese, é apresentado um novo framework chamado Meta-CLEO, que usa o meta-aprendizado para criar ensembles para novas tarefas relacionando-as com tarefas aprendidas anteriormente, aproveitando ensembles de classificadores que funcionaram bem em tarefas semelhantes no passado. Métricas de diversidade específicas de ensembles também são usadas para proporcionar maior generalização. Os experimentos realizados com 74 tarefas avaliaram diferentes algoritmos de ranqueamento de ensembles com base no desempenho do ensemble e nas métricas de diversidade e compararam os resultados do Meta-CLEO com dois baselines, Random Forest e AdaBoost. Os resultados mostram que o Meta-CLEO é equivalente ou tem desempenho superior aos baselines em mais de 75% das tarefas avaliadas.As machine learning becomes more popular, it is natural for non-experts to desire to leverage machine learning for their tasks. However, selecting an algorithm and fine-tuning it to work well on a given task is complex and requires technical knowledge, which they usually lack. This issue is even more evident when ensembles are used, as the number of algorithms to choose from and hyperparameters to tune grows significantly. Ensembles are particularly useful in complex tasks that involve challenges such as class imbalance or high dimensionality, which are often encountered in domain-specific tasks. Thus, developing mechanisms that help the non-technical user choose and tune an ensemble model to fit a task is highly relevant in the area of machine learning. In this thesis, a novel framework is presented called Meta-CLEO, which uses meta-learning to create ensembles for new tasks by relating them to previously learned ones, thus leveraging classifier ensembles that worked well on similar tasks in the past. Ensemble-specific diversity metrics are also used to provide increased generalization. Experiments with 74 tasks evaluated different ensemble ranking functions based on ensemble performance and diversity metrics and compared Meta-CLEO’s results with two baselines, Random Forest and AdaBoost. Results show that Meta-CLEO is equivalent to or outperforms the baselines in more than 75% of the evaluated tasks.application/pdfengAprendizado de máquinaOtimização computacionalAlgoritmos de ranqueamentoMeta-aprendizagemEnsemblesClassification tasksMeta-learning for classifier ensemble optimizationMeta-aprendizado para a otimização de ensembles de classificação info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2024mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001209361.pdf.txt001209361.pdf.txtExtracted Texttext/plain128777http://www.lume.ufrgs.br/bitstream/10183/277571/2/001209361.pdf.txt61ee8dc42fa0e0722c16dedf7d562e3eMD52ORIGINAL001209361.pdfTexto completo (inglês)application/pdf769143http://www.lume.ufrgs.br/bitstream/10183/277571/1/001209361.pdf52d28f5879fbe0861f6a7b8006541e95MD5110183/2775712024-08-24 06:42:39.084341oai:www.lume.ufrgs.br:10183/277571Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-08-24T09:42:39Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Meta-learning for classifier ensemble optimization
dc.title.alternative.pt.fl_str_mv Meta-aprendizado para a otimização de ensembles de classificação
title Meta-learning for classifier ensemble optimization
spellingShingle Meta-learning for classifier ensemble optimization
Schmitz, Christian
Aprendizado de máquina
Otimização computacional
Algoritmos de ranqueamento
Meta-aprendizagem
Ensembles
Classification tasks
title_short Meta-learning for classifier ensemble optimization
title_full Meta-learning for classifier ensemble optimization
title_fullStr Meta-learning for classifier ensemble optimization
title_full_unstemmed Meta-learning for classifier ensemble optimization
title_sort Meta-learning for classifier ensemble optimization
author Schmitz, Christian
author_facet Schmitz, Christian
author_role author
dc.contributor.author.fl_str_mv Schmitz, Christian
dc.contributor.advisor1.fl_str_mv Galante, Renata de Matos
contributor_str_mv Galante, Renata de Matos
dc.subject.por.fl_str_mv Aprendizado de máquina
Otimização computacional
Algoritmos de ranqueamento
Meta-aprendizagem
topic Aprendizado de máquina
Otimização computacional
Algoritmos de ranqueamento
Meta-aprendizagem
Ensembles
Classification tasks
dc.subject.eng.fl_str_mv Ensembles
Classification tasks
description À medida que o aprendizado de máquina se torna mais popular, é natural que profissionais de outras áreas e que não são especialistas queiram aproveitá-lo em suas tarefas. No entanto, selecionar um algoritmo e ajustá-lo para que funcione bem em uma determinada tarefa é complexo e requer conhecimento técnico em aprendizado de máquina, que os profissionais de outros domínios em geral não possuem. Esse problema fica ainda mais evidente quando são usados ensembles, pois o número de algoritmos a serem escolhidos e de hiperparâmetros a serem ajustados aumenta significativamente. Os ensembles são particularmente úteis em tarefas complexas que envolvem desafios como desequilíbrio de classe ou alta dimensionalidade, que são frequentemente encontrados em tarefas específicas de domínio. Assim, o desenvolvimento de mecanismos que ajudem o usuário não técnico a escolher e ajustar um modelo de ensembles para se resolver uma tarefa é de grande relevância na área de aprendizado de máquina. Nesta tese, é apresentado um novo framework chamado Meta-CLEO, que usa o meta-aprendizado para criar ensembles para novas tarefas relacionando-as com tarefas aprendidas anteriormente, aproveitando ensembles de classificadores que funcionaram bem em tarefas semelhantes no passado. Métricas de diversidade específicas de ensembles também são usadas para proporcionar maior generalização. Os experimentos realizados com 74 tarefas avaliaram diferentes algoritmos de ranqueamento de ensembles com base no desempenho do ensemble e nas métricas de diversidade e compararam os resultados do Meta-CLEO com dois baselines, Random Forest e AdaBoost. Os resultados mostram que o Meta-CLEO é equivalente ou tem desempenho superior aos baselines em mais de 75% das tarefas avaliadas.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-08-23T06:29:51Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/277571
dc.identifier.nrb.pt_BR.fl_str_mv 001209361
url http://hdl.handle.net/10183/277571
identifier_str_mv 001209361
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/277571/2/001209361.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/277571/1/001209361.pdf
bitstream.checksum.fl_str_mv 61ee8dc42fa0e0722c16dedf7d562e3e
52d28f5879fbe0861f6a7b8006541e95
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085650271043584