Analysis of machine learning ensembles based on diversity measures
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/216552 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Automação e Sistemas, Florianópolis, 2020. |
id |
UFSC_48a9399aec2f743446e471452d165f8a |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/216552 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Analysis of machine learning ensembles based on diversity measuresEngenharia de sistemasAutomaçãoAprendizado do computadorDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Automação e Sistemas, Florianópolis, 2020.O aprendizado de máquina se popularizou muito nos últimos anos devido ao desenvolvimento de novos algoritmos e teorias, ao crescente acesso aos dados e à crescente capacidade computacional. Neste contexto, existe uma busca constante por maior exatidão das predições realizadas. Dentre as possibilidades existentes, o ensemble de vários modelos tem se destacado em competições de aprendizado de máquina e também em congressos da área por apresentar alta exatidão. No entanto, como consequência, alguns desafios surgem. A complexidade do modelo e o tempo de treinamento aumentam, enquanto a sua interpretabilidade diminui. Não é trivial determinar quais modelos devem ser utilizados e como eles devem ser organizados. Esta dissertação analisa o desempenho do ensemble e a sua relação com a diversidade dos modelos que o compõe com o objetivo de mostrar um conjunto de abordagens com boa probabilidade para se obter um bom resultado. Em outras palavras, fazer com que as predições do ensemble como um todo sejam melhores do que as predições individuais de qualquer um dos modelos que o compõe. Para que este objetivo fosse possível, foi construída uma arquitetura para realização dos experimentos, em que os algoritmos são executados de forma paralela. Os resultados mostram estratégias que funcionaram na prática baseados na literatura da área e no estudo da diversidade de modelos.Abstract: Machine learning has become very popular in recent years due to the development of new algorithms and theories, the increasing access to data and the increasing computational capacity. In this context, there is a constant search for greater accuracy in the predictions made. Among the existing possibilities, the ensemble of several models has stood out in machine learning competitions and also in congresses in the area for presenting high precision. However, as a consequence, some challenges arise. The complexity of the model and the training time increase, while its interpretability decreases. It is not trivial to determine which models should be used and how they should be organized. This thesis analyzes the performance of the ensemble and its relationship with the diversity of the models that compose it with the objective of showing a set of approaches with good probability to obtain a good result. In other words, making the predictions of the ensemble as a whole better than the individual predictions of any of the models that compose it. To make this objective possible, an architecture was built to carry out the experiments, where the models are executed in parallel. The results show strategies that have worked in practice based on the literature in the area and on the study of the diversity of models.Hübner, Jomi FredUniversidade Federal de Santa CatarinaLuca, Vitor Hugo Medeiros De2020-10-21T21:31:14Z2020-10-21T21:31:14Z2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis70 p.| il., gráfs.application/pdf370054https://repositorio.ufsc.br/handle/123456789/216552engreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2020-10-21T21:31:14Zoai:repositorio.ufsc.br:123456789/216552Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732020-10-21T21:31:14Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Analysis of machine learning ensembles based on diversity measures |
title |
Analysis of machine learning ensembles based on diversity measures |
spellingShingle |
Analysis of machine learning ensembles based on diversity measures Luca, Vitor Hugo Medeiros De Engenharia de sistemas Automação Aprendizado do computador |
title_short |
Analysis of machine learning ensembles based on diversity measures |
title_full |
Analysis of machine learning ensembles based on diversity measures |
title_fullStr |
Analysis of machine learning ensembles based on diversity measures |
title_full_unstemmed |
Analysis of machine learning ensembles based on diversity measures |
title_sort |
Analysis of machine learning ensembles based on diversity measures |
author |
Luca, Vitor Hugo Medeiros De |
author_facet |
Luca, Vitor Hugo Medeiros De |
author_role |
author |
dc.contributor.none.fl_str_mv |
Hübner, Jomi Fred Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Luca, Vitor Hugo Medeiros De |
dc.subject.por.fl_str_mv |
Engenharia de sistemas Automação Aprendizado do computador |
topic |
Engenharia de sistemas Automação Aprendizado do computador |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia de Automação e Sistemas, Florianópolis, 2020. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-10-21T21:31:14Z 2020-10-21T21:31:14Z 2020 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
370054 https://repositorio.ufsc.br/handle/123456789/216552 |
identifier_str_mv |
370054 |
url |
https://repositorio.ufsc.br/handle/123456789/216552 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
70 p.| il., gráfs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808652213737750528 |