Discretizador heurístico para o contexto de classificação hierárquica.

Detalhes bibliográficos
Autor(a) principal: Galvão, Leandro Ribeiro
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFOP
Texto Completo: http://www.repositorio.ufop.br/handle/123456789/6538
Resumo: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
id UFOP_b1fe90a2fad60e84297c504fa840f8af
oai_identifier_str oai:localhost:123456789/6538
network_acronym_str UFOP
network_name_str Repositório Institucional da UFOP
repository_id_str 3233
spelling Galvão, Leandro RibeiroSilla Júnior, Carlos NascimentoPappa, Gisele LoboFerreira, Almeida FerreiraMerschmann, Luiz Henrique de Campos2016-06-16T13:34:26Z2016-06-16T13:34:26Z2016GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 2016. 54 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.http://www.repositorio.ufop.br/handle/123456789/6538Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Diferentes tipos de problemas de classificação podem ser encontrados na literatura, cada qual possuindo seu nível de complexidade. Diversos algoritmos de aprendizado de máquina requerem atributos discretos e nesses casos o pré-processamento da base de dados né necessário. Na literatura, os trabalhos apresentam diversos métodos de discretização, porém até o momento, não há nenhum método de discretização supervisionado projetado para ser utilizada em conjunto com classificadores hierárquicos globais. Neste trabalho é proposto um método supervisionado de discretização capaz de lidar com bases do contexto de classificação hierárquica. Esse método corresponde a uma heurística, denominada Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, que foi projetada para ser utilizada em conjunto com classificadores hierárquicos globais. A avaliação da qualidade da discretização realizada pela heurística ADH2C foi feita a partir de experimentos comparativos com métodos de discretização não-supervisionados Equal-Width (EW) e Equal-Frequency (EF). A qualidade da discretização foi medida por meio do desempenho preditivo pelo classificador hierárquico Global Model Naive Bayes (GMNB) utilizando-se 9 bases de dados de bioinformática pré-processadas pelos métodos de discretização EW, EF e ADH2C. Os experimentos realizados neste trabalho mostraram que para a maioria das bases de dados utilizadas, o classificador GMNB alcançou o melhor desempenho preditivo (hF) quando utilizou as bases de dados pré-processadas pela heurística ADH2C. A melhora no desempenho preditivo do GMNB, utilizando as bases de dados pré-processadas pela heurística ADH2C, evidencia sua aplicabilidade no contexto de classificação hierárquica monorrótulo.Several classification tasks in different application domains can be seen as hierarchical classification problems. Many machine learning algorithms require discrete data. Then, it is mandatory the use of a discretization method. In order to be used together with global hierarchical methods, the use of the existing supervised flat discretization methods is not appropriate. For this reason, there has been used unsupervised discretization methods which ignores the class attribute. In this work, we propose a supervised discretization method for hierarchical classification scenario. The proposed heuristic, known as Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, is able to deal with hierarchical class structure and can be used with global hierarchical classifiers. Experimental evaluation is performed through the preprocessing of 9 bioinformatics datasets. The hierarchical classification method Global Model Naive Bayes - GMNB, was adopted to measure the quality of the discretization. As far as we known, there is no supervised discretization method able to be used with hierarchical classification methods. Due to it, as baseline methods for experimental comparison, we adopted the unsupervised methods Equal-Frequency and Equal-Width. Analyses of the experimental results showed that, for most of datasets, the GMNB classifier achieved higher predictive performance when they were preprocessed using ADH2C method. The proposed supervised discretization method has shown good performance in the hierarchical classification scenario and, therefore, can be used together with global hierarchical classification methods.Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 13/06/2016 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessDistribuição - probabilidadesClassificação - computadoresProgramação heurísticaDiscretizador heurístico para o contexto de classificação hierárquica.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-8924http://www.repositorio.ufop.br/bitstream/123456789/6538/5/license.txt62604f8d955274beb56c80ce1ee5dcaeMD55CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://www.repositorio.ufop.br/bitstream/123456789/6538/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-822064http://www.repositorio.ufop.br/bitstream/123456789/6538/3/license_textef48816a10f2d45f2e2fee2f478e2fafMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823148http://www.repositorio.ufop.br/bitstream/123456789/6538/4/license_rdf9da0b6dfac957114c6a7714714b86306MD54ORIGINALDISSERTAÇÃO_DiscretizadorHeurísticoContexto.pdfDISSERTAÇÃO_DiscretizadorHeurísticoContexto.pdfapplication/pdf10258194http://www.repositorio.ufop.br/bitstream/123456789/6538/1/DISSERTA%c3%87%c3%83O_DiscretizadorHeur%c3%adsticoContexto.pdf5224ea291c9eba937b7cd636b3280e61MD51123456789/65382019-09-19 09:10:46.456oai:localhost:123456789/6538RGVjbGFyYcOnw6NvIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhCgpPIHJlZmVyaWRvIGF1dG9yOgoKYSlEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBwZXNzb2Egb3UgZW50aWRhZGUuCgpiKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0by9VRk9QIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MsIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpjKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVUZPUCwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gY29udHJhdG8gb3UgYWNvcmRvLgoKRepositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332019-09-19T13:10:46Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false
dc.title.pt_BR.fl_str_mv Discretizador heurístico para o contexto de classificação hierárquica.
title Discretizador heurístico para o contexto de classificação hierárquica.
spellingShingle Discretizador heurístico para o contexto de classificação hierárquica.
Galvão, Leandro Ribeiro
Distribuição - probabilidades
Classificação - computadores
Programação heurística
title_short Discretizador heurístico para o contexto de classificação hierárquica.
title_full Discretizador heurístico para o contexto de classificação hierárquica.
title_fullStr Discretizador heurístico para o contexto de classificação hierárquica.
title_full_unstemmed Discretizador heurístico para o contexto de classificação hierárquica.
title_sort Discretizador heurístico para o contexto de classificação hierárquica.
author Galvão, Leandro Ribeiro
author_facet Galvão, Leandro Ribeiro
author_role author
dc.contributor.referee.pt_BR.fl_str_mv Silla Júnior, Carlos Nascimento
Pappa, Gisele Lobo
Ferreira, Almeida Ferreira
dc.contributor.author.fl_str_mv Galvão, Leandro Ribeiro
dc.contributor.advisor1.fl_str_mv Merschmann, Luiz Henrique de Campos
contributor_str_mv Merschmann, Luiz Henrique de Campos
dc.subject.por.fl_str_mv Distribuição - probabilidades
Classificação - computadores
Programação heurística
topic Distribuição - probabilidades
Classificação - computadores
Programação heurística
description Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
publishDate 2016
dc.date.accessioned.fl_str_mv 2016-06-16T13:34:26Z
dc.date.available.fl_str_mv 2016-06-16T13:34:26Z
dc.date.issued.fl_str_mv 2016
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 2016. 54 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.
dc.identifier.uri.fl_str_mv http://www.repositorio.ufop.br/handle/123456789/6538
identifier_str_mv GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 2016. 54 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.
url http://www.repositorio.ufop.br/handle/123456789/6538
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFOP
instname:Universidade Federal de Ouro Preto (UFOP)
instacron:UFOP
instname_str Universidade Federal de Ouro Preto (UFOP)
instacron_str UFOP
institution UFOP
reponame_str Repositório Institucional da UFOP
collection Repositório Institucional da UFOP
bitstream.url.fl_str_mv http://www.repositorio.ufop.br/bitstream/123456789/6538/5/license.txt
http://www.repositorio.ufop.br/bitstream/123456789/6538/2/license_url
http://www.repositorio.ufop.br/bitstream/123456789/6538/3/license_text
http://www.repositorio.ufop.br/bitstream/123456789/6538/4/license_rdf
http://www.repositorio.ufop.br/bitstream/123456789/6538/1/DISSERTA%c3%87%c3%83O_DiscretizadorHeur%c3%adsticoContexto.pdf
bitstream.checksum.fl_str_mv 62604f8d955274beb56c80ce1ee5dcae
4afdbb8c545fd630ea7db775da747b2f
ef48816a10f2d45f2e2fee2f478e2faf
9da0b6dfac957114c6a7714714b86306
5224ea291c9eba937b7cd636b3280e61
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)
repository.mail.fl_str_mv repositorio@ufop.edu.br
_version_ 1801685778175098880