Meta-learning for classifier ensemble optimization
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/277571 |
Resumo: | À medida que o aprendizado de máquina se torna mais popular, é natural que profissionais de outras áreas e que não são especialistas queiram aproveitá-lo em suas tarefas. No entanto, selecionar um algoritmo e ajustá-lo para que funcione bem em uma determinada tarefa é complexo e requer conhecimento técnico em aprendizado de máquina, que os profissionais de outros domínios em geral não possuem. Esse problema fica ainda mais evidente quando são usados ensembles, pois o número de algoritmos a serem escolhidos e de hiperparâmetros a serem ajustados aumenta significativamente. Os ensembles são particularmente úteis em tarefas complexas que envolvem desafios como desequilíbrio de classe ou alta dimensionalidade, que são frequentemente encontrados em tarefas específicas de domínio. Assim, o desenvolvimento de mecanismos que ajudem o usuário não técnico a escolher e ajustar um modelo de ensembles para se resolver uma tarefa é de grande relevância na área de aprendizado de máquina. Nesta tese, é apresentado um novo framework chamado Meta-CLEO, que usa o meta-aprendizado para criar ensembles para novas tarefas relacionando-as com tarefas aprendidas anteriormente, aproveitando ensembles de classificadores que funcionaram bem em tarefas semelhantes no passado. Métricas de diversidade específicas de ensembles também são usadas para proporcionar maior generalização. Os experimentos realizados com 74 tarefas avaliaram diferentes algoritmos de ranqueamento de ensembles com base no desempenho do ensemble e nas métricas de diversidade e compararam os resultados do Meta-CLEO com dois baselines, Random Forest e AdaBoost. Os resultados mostram que o Meta-CLEO é equivalente ou tem desempenho superior aos baselines em mais de 75% das tarefas avaliadas. |
id |
URGS_e7a91b77b97e4a6e2ab3a088da62d851 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/277571 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Schmitz, ChristianGalante, Renata de Matos2024-08-23T06:29:51Z2024http://hdl.handle.net/10183/277571001209361À medida que o aprendizado de máquina se torna mais popular, é natural que profissionais de outras áreas e que não são especialistas queiram aproveitá-lo em suas tarefas. No entanto, selecionar um algoritmo e ajustá-lo para que funcione bem em uma determinada tarefa é complexo e requer conhecimento técnico em aprendizado de máquina, que os profissionais de outros domínios em geral não possuem. Esse problema fica ainda mais evidente quando são usados ensembles, pois o número de algoritmos a serem escolhidos e de hiperparâmetros a serem ajustados aumenta significativamente. Os ensembles são particularmente úteis em tarefas complexas que envolvem desafios como desequilíbrio de classe ou alta dimensionalidade, que são frequentemente encontrados em tarefas específicas de domínio. Assim, o desenvolvimento de mecanismos que ajudem o usuário não técnico a escolher e ajustar um modelo de ensembles para se resolver uma tarefa é de grande relevância na área de aprendizado de máquina. Nesta tese, é apresentado um novo framework chamado Meta-CLEO, que usa o meta-aprendizado para criar ensembles para novas tarefas relacionando-as com tarefas aprendidas anteriormente, aproveitando ensembles de classificadores que funcionaram bem em tarefas semelhantes no passado. Métricas de diversidade específicas de ensembles também são usadas para proporcionar maior generalização. Os experimentos realizados com 74 tarefas avaliaram diferentes algoritmos de ranqueamento de ensembles com base no desempenho do ensemble e nas métricas de diversidade e compararam os resultados do Meta-CLEO com dois baselines, Random Forest e AdaBoost. Os resultados mostram que o Meta-CLEO é equivalente ou tem desempenho superior aos baselines em mais de 75% das tarefas avaliadas.As machine learning becomes more popular, it is natural for non-experts to desire to leverage machine learning for their tasks. However, selecting an algorithm and fine-tuning it to work well on a given task is complex and requires technical knowledge, which they usually lack. This issue is even more evident when ensembles are used, as the number of algorithms to choose from and hyperparameters to tune grows significantly. Ensembles are particularly useful in complex tasks that involve challenges such as class imbalance or high dimensionality, which are often encountered in domain-specific tasks. Thus, developing mechanisms that help the non-technical user choose and tune an ensemble model to fit a task is highly relevant in the area of machine learning. In this thesis, a novel framework is presented called Meta-CLEO, which uses meta-learning to create ensembles for new tasks by relating them to previously learned ones, thus leveraging classifier ensembles that worked well on similar tasks in the past. Ensemble-specific diversity metrics are also used to provide increased generalization. Experiments with 74 tasks evaluated different ensemble ranking functions based on ensemble performance and diversity metrics and compared Meta-CLEO’s results with two baselines, Random Forest and AdaBoost. Results show that Meta-CLEO is equivalent to or outperforms the baselines in more than 75% of the evaluated tasks.application/pdfengAprendizado de máquinaOtimização computacionalAlgoritmos de ranqueamentoMeta-aprendizagemEnsemblesClassification tasksMeta-learning for classifier ensemble optimizationMeta-aprendizado para a otimização de ensembles de classificação info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2024mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001209361.pdf.txt001209361.pdf.txtExtracted Texttext/plain128777http://www.lume.ufrgs.br/bitstream/10183/277571/2/001209361.pdf.txt61ee8dc42fa0e0722c16dedf7d562e3eMD52ORIGINAL001209361.pdfTexto completo (inglês)application/pdf769143http://www.lume.ufrgs.br/bitstream/10183/277571/1/001209361.pdf52d28f5879fbe0861f6a7b8006541e95MD5110183/2775712024-08-24 06:42:39.084341oai:www.lume.ufrgs.br:10183/277571Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-08-24T09:42:39Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Meta-learning for classifier ensemble optimization |
dc.title.alternative.pt.fl_str_mv |
Meta-aprendizado para a otimização de ensembles de classificação |
title |
Meta-learning for classifier ensemble optimization |
spellingShingle |
Meta-learning for classifier ensemble optimization Schmitz, Christian Aprendizado de máquina Otimização computacional Algoritmos de ranqueamento Meta-aprendizagem Ensembles Classification tasks |
title_short |
Meta-learning for classifier ensemble optimization |
title_full |
Meta-learning for classifier ensemble optimization |
title_fullStr |
Meta-learning for classifier ensemble optimization |
title_full_unstemmed |
Meta-learning for classifier ensemble optimization |
title_sort |
Meta-learning for classifier ensemble optimization |
author |
Schmitz, Christian |
author_facet |
Schmitz, Christian |
author_role |
author |
dc.contributor.author.fl_str_mv |
Schmitz, Christian |
dc.contributor.advisor1.fl_str_mv |
Galante, Renata de Matos |
contributor_str_mv |
Galante, Renata de Matos |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Otimização computacional Algoritmos de ranqueamento Meta-aprendizagem |
topic |
Aprendizado de máquina Otimização computacional Algoritmos de ranqueamento Meta-aprendizagem Ensembles Classification tasks |
dc.subject.eng.fl_str_mv |
Ensembles Classification tasks |
description |
À medida que o aprendizado de máquina se torna mais popular, é natural que profissionais de outras áreas e que não são especialistas queiram aproveitá-lo em suas tarefas. No entanto, selecionar um algoritmo e ajustá-lo para que funcione bem em uma determinada tarefa é complexo e requer conhecimento técnico em aprendizado de máquina, que os profissionais de outros domínios em geral não possuem. Esse problema fica ainda mais evidente quando são usados ensembles, pois o número de algoritmos a serem escolhidos e de hiperparâmetros a serem ajustados aumenta significativamente. Os ensembles são particularmente úteis em tarefas complexas que envolvem desafios como desequilíbrio de classe ou alta dimensionalidade, que são frequentemente encontrados em tarefas específicas de domínio. Assim, o desenvolvimento de mecanismos que ajudem o usuário não técnico a escolher e ajustar um modelo de ensembles para se resolver uma tarefa é de grande relevância na área de aprendizado de máquina. Nesta tese, é apresentado um novo framework chamado Meta-CLEO, que usa o meta-aprendizado para criar ensembles para novas tarefas relacionando-as com tarefas aprendidas anteriormente, aproveitando ensembles de classificadores que funcionaram bem em tarefas semelhantes no passado. Métricas de diversidade específicas de ensembles também são usadas para proporcionar maior generalização. Os experimentos realizados com 74 tarefas avaliaram diferentes algoritmos de ranqueamento de ensembles com base no desempenho do ensemble e nas métricas de diversidade e compararam os resultados do Meta-CLEO com dois baselines, Random Forest e AdaBoost. Os resultados mostram que o Meta-CLEO é equivalente ou tem desempenho superior aos baselines em mais de 75% das tarefas avaliadas. |
publishDate |
2024 |
dc.date.accessioned.fl_str_mv |
2024-08-23T06:29:51Z |
dc.date.issued.fl_str_mv |
2024 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/277571 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001209361 |
url |
http://hdl.handle.net/10183/277571 |
identifier_str_mv |
001209361 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/277571/2/001209361.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/277571/1/001209361.pdf |
bitstream.checksum.fl_str_mv |
61ee8dc42fa0e0722c16dedf7d562e3e 52d28f5879fbe0861f6a7b8006541e95 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085650271043584 |