A meta-learning approach for selecting machine learning algorithms

Detalhes bibliográficos
Autor(a) principal: Monteiro, José Pedro Santos
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/84140
Resumo: Dissertação de mestrado em Computer Science
id RCAP_048e08b7b8debc1588b4b78d2806c7a6
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/84140
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling A meta-learning approach for selecting machine learning algorithmsMachine learningMeta-learningMetadataMachine learning algorithms selectionClassificationData miningMetadadosSeleção de algoritmosProblemas de classificaçãoAnálise de dadosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado em Computer ScienceOne of the major challenges in Machine Learning is to investigate the capabilities and lim itations of the existing algorithms to identify when one algorithm is more adequate than another to solve particular problems. Traditional approaches to predicting the performance of algorithms often involve costly trial-and-error procedures or expert knowledge, which is not always straightforward to acquire. Thus, the main goal of this dissertation is to support beginners or even experienced data scientists by automatically indicating which classifica tion algorithm is most suitable for their datasets. This dissertation proposes the use of Meta-Learning as a possible solution to the above mentioned problem. In this respect, we introduced a novel framework for the automatic generation of meta-datasets. Taking advantage of the developed framework, several clas sification datasets from public sources were used. The result is the meta-dataset for the experiment of this research project. Concerning the goal of forecasting the best model for a classification dataset, two different solutions are presented: the first toward binary classification and the second on multiclass classification. A variety of Machine Learning algorithms are tested and compared through cross-validation. The experiment confirms the feasibility of applying Meta-Learning to select the algorithm that is expected to obtain the best performance for classification problems.Um dos principais desafios do Machine Learning passa por investigar os recursos e as limitações dos algoritmos existentes para identificar quando é que um algoritmo é mais adequado do que outro para resolver um determinado problema. Por norma, as abordagens tradicionais envolvem procedimentos de tentativa e erro, que requerem muito tempo ou conhecimento especializado, o que nem sempre e fácil de adquirir. Assim, a presente dissertação pretende auxiliar iniciantes, indivíduos que não são cientistas de dados e até cientistas de dados experientes, indicando automaticamente qual o algoritmo que é mais vantajoso para os seus conjuntos de dados de classificação. O presente trabalho propõe a utilização de Meta-Learning como uma possível solução para o problema acima mencionado. Numa primeira etapa é apresentada uma Framework para extração automática de meta-características informativas. Tirando recurso da Framework desenvolvida, foram utilizados vários conjuntos de dados de classificação de fontes públicas, gerando assim o meta conjunto de dados para o experimento desta dissertação. Relativamente a meta previsão do melhor modelo a utilizar, foram abordadas duas soluções: uma primeira focada em classificação binária e a segunda em classificação com múltiplas classes. Em ambas foram testados e comparados vários algoritmos de Machine Learning através de validação cruzada. O experimento confirmou a viabilidade da aplicação de Meta-Learning para a seleção de algoritmos com melhor desempenho em problemas de classificação.Fernandes, João M.Duarte, Francisco J.Universidade do MinhoMonteiro, José Pedro Santos2020-06-162020-06-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/84140eng203044428info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:25:45Zoai:repositorium.sdum.uminho.pt:1822/84140Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:20:04.265639Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv A meta-learning approach for selecting machine learning algorithms
title A meta-learning approach for selecting machine learning algorithms
spellingShingle A meta-learning approach for selecting machine learning algorithms
Monteiro, José Pedro Santos
Machine learning
Meta-learning
Metadata
Machine learning algorithms selection
Classification
Data mining
Metadados
Seleção de algoritmos
Problemas de classificação
Análise de dados
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short A meta-learning approach for selecting machine learning algorithms
title_full A meta-learning approach for selecting machine learning algorithms
title_fullStr A meta-learning approach for selecting machine learning algorithms
title_full_unstemmed A meta-learning approach for selecting machine learning algorithms
title_sort A meta-learning approach for selecting machine learning algorithms
author Monteiro, José Pedro Santos
author_facet Monteiro, José Pedro Santos
author_role author
dc.contributor.none.fl_str_mv Fernandes, João M.
Duarte, Francisco J.
Universidade do Minho
dc.contributor.author.fl_str_mv Monteiro, José Pedro Santos
dc.subject.por.fl_str_mv Machine learning
Meta-learning
Metadata
Machine learning algorithms selection
Classification
Data mining
Metadados
Seleção de algoritmos
Problemas de classificação
Análise de dados
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Machine learning
Meta-learning
Metadata
Machine learning algorithms selection
Classification
Data mining
Metadados
Seleção de algoritmos
Problemas de classificação
Análise de dados
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado em Computer Science
publishDate 2020
dc.date.none.fl_str_mv 2020-06-16
2020-06-16T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/84140
url https://hdl.handle.net/1822/84140
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203044428
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132661678080000