Modelo de ensembles multiníveis para classificadores
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/handle/123456789/193630 |
Resumo: | Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018. |
id |
UFSC_3ef89e92b74a18f1df8839cd4611ef56 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/193630 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Modelo de ensembles multiníveis para classificadoresComputaçãoAprendizado do computadorDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018.Um comitê de máquinas, ou ensemble, é uma combinação de diversos classificadores por meio de uma estratégia pré-estabelecida. Seu uso tem sido comum na literatura para garantir um aumento de generali- zação nos problemas de classificação. Entretanto, é fundamental o uso de uma boa estratégia de diversidade para assegurar a qualidade dos resultados. Para tanto, a presente pesquisa propõe a construção de um modelo multinível, onde a decisão final é realizada por meio da com- binação das saídas de ensembles. A esse modelo refere-se aqui como comitê de ensembles. O tema da presente dissertação buscou avançar o estado da arte ao propor uma estratégia para a realização do comitê de ensembles. Propôs-se ainda a combinação de ensembles que tenham em sua formação classificadores com similaridades entre si. Dessa forma, cada ensemble do comitê especializa-se em determinado paradigma de aprendizagem (família). Busca-se com isso um aumento ainda maior da diversidade. A aplicação do modelo proposto (nível 2) ocorreu em bases de dados públicas com diferentes características e sua avaliação foi mensurada por meio da acurácia, área sob a curva ROC (AUC) e tempo de execução. Os resultados mostraram semelhanças de desem- penho dos níveis 0 e 1. O modelo proposto conseguiu um crescimento médio de até 14% e 10% em relação à, respectivamente, acurácia e área sob a curva ROC dos níveis 0 e 1. A família que apresentou os me- lhores resultados foi a Bayesiana. Os resultados demonstraram que o desempenho da família bayesiana foi 949 vezes mais rápido no tempo de execução que o comitê de ensembles com os resultados de acurácia e área sob a curva ROC mais estáveis e levemente superior às demais famílias (nível 1). Por fim, a análise estatística, com um nível de sig- nificância de 5% (a = 0, 05), comprovou o bom desempenho do comitê de ensembles em quase todas as comparações em relação aos demais níveis tanto em termos de acurácia quanto de área sob a curva ROC, embora com um alto tempo de execução.Abstract : A committee machine, or ensemble, is a combination of several classifi- ers by means of a pre-established strategy. Its use has been common in the literature to ensure an increase the generalization in classification problems. However, a good diversity strategy is essential to ensure the quality of results. Therefore, the present research proposes the cons- truction of a multi-level model, where the final decision is made through the combination of ensembles outputs. This model is referred to here as an committee ensembles. The theme of this dissertation sought to advance the state of the art by proposing a strategy for the accomplish- ment of the committee ensembles. It s also proposed the combination of ensembles that have in their formation classifiers with similarities among themselves. Therefore, each committee ensemble specializes in a particular learning paradigm (family). An increase in diversity is thus sought. The validation of the proposed method (level 2) use public da- tabases with different characteristics and its evaluation was measured by means of accuracy, area under the ROC curve (AUC) and processing time. The results showed similarities of performance of levels 0 and 1. The proposed model achieved an average growth of up to 14% and 10% in relation to, respectively, accuracy and area under the ROC curve of levels 0 and 1. The family that presented the best results was Bayesian. The results showed that the performance of the Bayesian family was 949 times faster in the execution time than committee ensembles with the results of accuracy and area under the ROC curve more stable and slightly superior to the other families (level 1). Our results are statisti- cally analyzed with a significance level of 5% (a = 0.05), which proved the increased good performance of the ensembles committee in almost all comparisons in relation to other levels both in terms of accuracy and area under the ROC curve, although with a high execution time.Nassar, Silvia ModestoUniversidade Federal de Santa CatarinaLorbieski, Rodolfo2019-03-07T04:01:37Z2019-03-07T04:01:37Z2018info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis87 p.| il., gráfs.application/pdf356034https://repositorio.ufsc.br/handle/123456789/193630porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2019-03-07T04:01:37Zoai:repositorio.ufsc.br:123456789/193630Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732019-03-07T04:01:37Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Modelo de ensembles multiníveis para classificadores |
title |
Modelo de ensembles multiníveis para classificadores |
spellingShingle |
Modelo de ensembles multiníveis para classificadores Lorbieski, Rodolfo Computação Aprendizado do computador |
title_short |
Modelo de ensembles multiníveis para classificadores |
title_full |
Modelo de ensembles multiníveis para classificadores |
title_fullStr |
Modelo de ensembles multiníveis para classificadores |
title_full_unstemmed |
Modelo de ensembles multiníveis para classificadores |
title_sort |
Modelo de ensembles multiníveis para classificadores |
author |
Lorbieski, Rodolfo |
author_facet |
Lorbieski, Rodolfo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Nassar, Silvia Modesto Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Lorbieski, Rodolfo |
dc.subject.por.fl_str_mv |
Computação Aprendizado do computador |
topic |
Computação Aprendizado do computador |
description |
Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2018. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018 2019-03-07T04:01:37Z 2019-03-07T04:01:37Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
356034 https://repositorio.ufsc.br/handle/123456789/193630 |
identifier_str_mv |
356034 |
url |
https://repositorio.ufsc.br/handle/123456789/193630 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
87 p.| il., gráfs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808651970505867264 |