Discretizador heurístico para o contexto de classificação hierárquica.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFOP |
Texto Completo: | http://www.repositorio.ufop.br/handle/123456789/6538 |
Resumo: | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
id |
UFOP_b1fe90a2fad60e84297c504fa840f8af |
---|---|
oai_identifier_str |
oai:localhost:123456789/6538 |
network_acronym_str |
UFOP |
network_name_str |
Repositório Institucional da UFOP |
repository_id_str |
3233 |
spelling |
Galvão, Leandro RibeiroSilla Júnior, Carlos NascimentoPappa, Gisele LoboFerreira, Almeida FerreiraMerschmann, Luiz Henrique de Campos2016-06-16T13:34:26Z2016-06-16T13:34:26Z2016GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 2016. 54 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.http://www.repositorio.ufop.br/handle/123456789/6538Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Diferentes tipos de problemas de classificação podem ser encontrados na literatura, cada qual possuindo seu nível de complexidade. Diversos algoritmos de aprendizado de máquina requerem atributos discretos e nesses casos o pré-processamento da base de dados né necessário. Na literatura, os trabalhos apresentam diversos métodos de discretização, porém até o momento, não há nenhum método de discretização supervisionado projetado para ser utilizada em conjunto com classificadores hierárquicos globais. Neste trabalho é proposto um método supervisionado de discretização capaz de lidar com bases do contexto de classificação hierárquica. Esse método corresponde a uma heurística, denominada Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, que foi projetada para ser utilizada em conjunto com classificadores hierárquicos globais. A avaliação da qualidade da discretização realizada pela heurística ADH2C foi feita a partir de experimentos comparativos com métodos de discretização não-supervisionados Equal-Width (EW) e Equal-Frequency (EF). A qualidade da discretização foi medida por meio do desempenho preditivo pelo classificador hierárquico Global Model Naive Bayes (GMNB) utilizando-se 9 bases de dados de bioinformática pré-processadas pelos métodos de discretização EW, EF e ADH2C. Os experimentos realizados neste trabalho mostraram que para a maioria das bases de dados utilizadas, o classificador GMNB alcançou o melhor desempenho preditivo (hF) quando utilizou as bases de dados pré-processadas pela heurística ADH2C. A melhora no desempenho preditivo do GMNB, utilizando as bases de dados pré-processadas pela heurística ADH2C, evidencia sua aplicabilidade no contexto de classificação hierárquica monorrótulo.Several classification tasks in different application domains can be seen as hierarchical classification problems. Many machine learning algorithms require discrete data. Then, it is mandatory the use of a discretization method. In order to be used together with global hierarchical methods, the use of the existing supervised flat discretization methods is not appropriate. For this reason, there has been used unsupervised discretization methods which ignores the class attribute. In this work, we propose a supervised discretization method for hierarchical classification scenario. The proposed heuristic, known as Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, is able to deal with hierarchical class structure and can be used with global hierarchical classifiers. Experimental evaluation is performed through the preprocessing of 9 bioinformatics datasets. The hierarchical classification method Global Model Naive Bayes - GMNB, was adopted to measure the quality of the discretization. As far as we known, there is no supervised discretization method able to be used with hierarchical classification methods. Due to it, as baseline methods for experimental comparison, we adopted the unsupervised methods Equal-Frequency and Equal-Width. Analyses of the experimental results showed that, for most of datasets, the GMNB classifier achieved higher predictive performance when they were preprocessed using ADH2C method. The proposed supervised discretization method has shown good performance in the hierarchical classification scenario and, therefore, can be used together with global hierarchical classification methods.Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 13/06/2016 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessDistribuição - probabilidadesClassificação - computadoresProgramação heurísticaDiscretizador heurístico para o contexto de classificação hierárquica.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-8924http://www.repositorio.ufop.br/bitstream/123456789/6538/5/license.txt62604f8d955274beb56c80ce1ee5dcaeMD55CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://www.repositorio.ufop.br/bitstream/123456789/6538/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-822064http://www.repositorio.ufop.br/bitstream/123456789/6538/3/license_textef48816a10f2d45f2e2fee2f478e2fafMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823148http://www.repositorio.ufop.br/bitstream/123456789/6538/4/license_rdf9da0b6dfac957114c6a7714714b86306MD54ORIGINALDISSERTAÇÃO_DiscretizadorHeurísticoContexto.pdfDISSERTAÇÃO_DiscretizadorHeurísticoContexto.pdfapplication/pdf10258194http://www.repositorio.ufop.br/bitstream/123456789/6538/1/DISSERTA%c3%87%c3%83O_DiscretizadorHeur%c3%adsticoContexto.pdf5224ea291c9eba937b7cd636b3280e61MD51123456789/65382019-09-19 09:10:46.456oai:localhost:123456789/6538RGVjbGFyYcOnw6NvIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhCgpPIHJlZmVyaWRvIGF1dG9yOgoKYSlEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBwZXNzb2Egb3UgZW50aWRhZGUuCgpiKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0by9VRk9QIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MsIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpjKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVUZPUCwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gY29udHJhdG8gb3UgYWNvcmRvLgoKRepositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332019-09-19T13:10:46Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false |
dc.title.pt_BR.fl_str_mv |
Discretizador heurístico para o contexto de classificação hierárquica. |
title |
Discretizador heurístico para o contexto de classificação hierárquica. |
spellingShingle |
Discretizador heurístico para o contexto de classificação hierárquica. Galvão, Leandro Ribeiro Distribuição - probabilidades Classificação - computadores Programação heurística |
title_short |
Discretizador heurístico para o contexto de classificação hierárquica. |
title_full |
Discretizador heurístico para o contexto de classificação hierárquica. |
title_fullStr |
Discretizador heurístico para o contexto de classificação hierárquica. |
title_full_unstemmed |
Discretizador heurístico para o contexto de classificação hierárquica. |
title_sort |
Discretizador heurístico para o contexto de classificação hierárquica. |
author |
Galvão, Leandro Ribeiro |
author_facet |
Galvão, Leandro Ribeiro |
author_role |
author |
dc.contributor.referee.pt_BR.fl_str_mv |
Silla Júnior, Carlos Nascimento Pappa, Gisele Lobo Ferreira, Almeida Ferreira |
dc.contributor.author.fl_str_mv |
Galvão, Leandro Ribeiro |
dc.contributor.advisor1.fl_str_mv |
Merschmann, Luiz Henrique de Campos |
contributor_str_mv |
Merschmann, Luiz Henrique de Campos |
dc.subject.por.fl_str_mv |
Distribuição - probabilidades Classificação - computadores Programação heurística |
topic |
Distribuição - probabilidades Classificação - computadores Programação heurística |
description |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
publishDate |
2016 |
dc.date.accessioned.fl_str_mv |
2016-06-16T13:34:26Z |
dc.date.available.fl_str_mv |
2016-06-16T13:34:26Z |
dc.date.issued.fl_str_mv |
2016 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 2016. 54 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016. |
dc.identifier.uri.fl_str_mv |
http://www.repositorio.ufop.br/handle/123456789/6538 |
identifier_str_mv |
GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 2016. 54 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016. |
url |
http://www.repositorio.ufop.br/handle/123456789/6538 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP |
instname_str |
Universidade Federal de Ouro Preto (UFOP) |
instacron_str |
UFOP |
institution |
UFOP |
reponame_str |
Repositório Institucional da UFOP |
collection |
Repositório Institucional da UFOP |
bitstream.url.fl_str_mv |
http://www.repositorio.ufop.br/bitstream/123456789/6538/5/license.txt http://www.repositorio.ufop.br/bitstream/123456789/6538/2/license_url http://www.repositorio.ufop.br/bitstream/123456789/6538/3/license_text http://www.repositorio.ufop.br/bitstream/123456789/6538/4/license_rdf http://www.repositorio.ufop.br/bitstream/123456789/6538/1/DISSERTA%c3%87%c3%83O_DiscretizadorHeur%c3%adsticoContexto.pdf |
bitstream.checksum.fl_str_mv |
62604f8d955274beb56c80ce1ee5dcae 4afdbb8c545fd630ea7db775da747b2f ef48816a10f2d45f2e2fee2f478e2faf 9da0b6dfac957114c6a7714714b86306 5224ea291c9eba937b7cd636b3280e61 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP) |
repository.mail.fl_str_mv |
repositorio@ufop.edu.br |
_version_ |
1801685778175098880 |