Modelo de ensembles multiníveis para classificadores

Detalhes bibliográficos
Autor(a) principal: Lorbieski, Rodolfo
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/193630
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.
id UFSC_3ef89e92b74a18f1df8839cd4611ef56
oai_identifier_str oai:repositorio.ufsc.br:123456789/193630
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Modelo de ensembles multiníveis para classificadoresComputaçãoAprendizado do computadorDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.Um comitê de máquinas, ou ensemble, é uma combinação de diversos classificadores por meio de uma estratégia pré-estabelecida. Seu uso tem sido comum na literatura para garantir um aumento de generali- zação nos problemas de classificação. Entretanto, é fundamental o uso de uma boa estratégia de diversidade para assegurar a qualidade dos resultados. Para tanto, a presente pesquisa propõe a construção de um modelo multinível, onde a decisão final é realizada por meio da com- binação das saídas de ensembles. A esse modelo refere-se aqui como comitê de ensembles. O tema da presente dissertação buscou avançar o estado da arte ao propor uma estratégia para a realização do comitê de ensembles. Propôs-se ainda a combinação de ensembles que tenham em sua formação classificadores com similaridades entre si. Dessa forma, cada ensemble do comitê especializa-se em determinado paradigma de aprendizagem (família). Busca-se com isso um aumento ainda maior da diversidade. A aplicação do modelo proposto (nível 2) ocorreu em bases de dados públicas com diferentes características e sua avaliação foi mensurada por meio da acurácia, área sob a curva ROC (AUC) e tempo de execução. Os resultados mostraram semelhanças de desem- penho dos níveis 0 e 1. O modelo proposto conseguiu um crescimento médio de até 14% e 10% em relação à, respectivamente, acurácia e área sob a curva ROC dos níveis 0 e 1. A família que apresentou os me- lhores resultados foi a Bayesiana. Os resultados demonstraram que o desempenho da família bayesiana foi 949 vezes mais rápido no tempo de execução que o comitê de ensembles com os resultados de acurácia e área sob a curva ROC mais estáveis e levemente superior às demais famílias (nível 1). Por fim, a análise estatística, com um nível de sig- nificância de 5% (a = 0, 05), comprovou o bom desempenho do comitê de ensembles em quase todas as comparações em relação aos demais níveis tanto em termos de acurácia quanto de área sob a curva ROC, embora com um alto tempo de execução.Abstract : A committee machine, or ensemble, is a combination of several classifi- ers by means of a pre-established strategy. Its use has been common in the literature to ensure an increase the generalization in classification problems. However, a good diversity strategy is essential to ensure the quality of results. Therefore, the present research proposes the cons- truction of a multi-level model, where the final decision is made through the combination of ensembles outputs. This model is referred to here as an committee ensembles. The theme of this dissertation sought to advance the state of the art by proposing a strategy for the accomplish- ment of the committee ensembles. It s also proposed the combination of ensembles that have in their formation classifiers with similarities among themselves. Therefore, each committee ensemble specializes in a particular learning paradigm (family). An increase in diversity is thus sought. The validation of the proposed method (level 2) use public da- tabases with different characteristics and its evaluation was measured by means of accuracy, area under the ROC curve (AUC) and processing time. The results showed similarities of performance of levels 0 and 1. The proposed model achieved an average growth of up to 14% and 10% in relation to, respectively, accuracy and area under the ROC curve of levels 0 and 1. The family that presented the best results was Bayesian. The results showed that the performance of the Bayesian family was 949 times faster in the execution time than committee ensembles with the results of accuracy and area under the ROC curve more stable and slightly superior to the other families (level 1). Our results are statisti- cally analyzed with a significance level of 5% (a = 0.05), which proved the increased good performance of the ensembles committee in almost all comparisons in relation to other levels both in terms of accuracy and area under the ROC curve, although with a high execution time.Nassar, Silvia ModestoUniversidade Federal de Santa CatarinaLorbieski, Rodolfo2019-03-07T04:01:37Z2019-03-07T04:01:37Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis87 p.| il., gráfs.application/pdf356034https://repositorio.ufsc.br/handle/123456789/193630porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2019-03-07T04:01:37Zoai:repositorio.ufsc.br:123456789/193630Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732019-03-07T04:01:37Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Modelo de ensembles multiníveis para classificadores
title Modelo de ensembles multiníveis para classificadores
spellingShingle Modelo de ensembles multiníveis para classificadores
Lorbieski, Rodolfo
Computação
Aprendizado do computador
title_short Modelo de ensembles multiníveis para classificadores
title_full Modelo de ensembles multiníveis para classificadores
title_fullStr Modelo de ensembles multiníveis para classificadores
title_full_unstemmed Modelo de ensembles multiníveis para classificadores
title_sort Modelo de ensembles multiníveis para classificadores
author Lorbieski, Rodolfo
author_facet Lorbieski, Rodolfo
author_role author
dc.contributor.none.fl_str_mv Nassar, Silvia Modesto
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Lorbieski, Rodolfo
dc.subject.por.fl_str_mv Computação
Aprendizado do computador
topic Computação
Aprendizado do computador
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.
publishDate 2018
dc.date.none.fl_str_mv 2018
2019-03-07T04:01:37Z
2019-03-07T04:01:37Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 356034
https://repositorio.ufsc.br/handle/123456789/193630
identifier_str_mv 356034
url https://repositorio.ufsc.br/handle/123456789/193630
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 87 p.| il., gráfs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651970505867264