Hybrid feature selection approaches using metaheuristics for hierarchical classification.

Detalhes bibliográficos
Autor(a) principal: Lima, Helen de Cássia Sousa da Costa
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UFOP
Texto Completo: http://www.repositorio.ufop.br/jspui/handle/123456789/14546
Resumo: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
id UFOP_42e329d6d038d01645badfe00d0224df
oai_identifier_str oai:repositorio.ufop.br:123456789/14546
network_acronym_str UFOP
network_name_str Repositório Institucional da UFOP
repository_id_str 3233
spelling Hybrid feature selection approaches using metaheuristics for hierarchical classification.ClassificaçãoWrapperFiltroMineração de dadosPrograma de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.A seleção de atributos é uma etapa de pré-processamento amplamente difundida na área de mineração de dados. Um de seus objetivos é reduzir o número de atributos originais de uma base de dados para melhorar o desempenho de um modelo preditivo. No entanto, apesar dos benefícios da seleção de atributos para a tarefa de classificação, até onde sabemos, poucos estudos na literatura abordam a seleção de atributos para o contexto de classificação hierárquica. Este trabalho propõe duas abordagens principais de seleção híbrida de atributos supervisionada, combinando uma etapa filtro com uma wrapper, na qual um classificador hierárquico global avalia subconjuntos de atributos. A primeira abordagem usa a metaheurística Busca em Vizinhança Variável Geral com um ranqueamento de atributos construído com a medida Incerteza Simétrica Hierárquica. A segunda abordagem propõe uma adaptação da medida de seleção de atributos baseada em correlação adaptada para classificação hierárquica e utiliza o algoritmo Best First Search para pesquisar o espaço de subconjuntos de atributos. Doze bases de dados dos domínios de proteína e imagem foram usadas para realizar experimentos computacionais para validar o desempenho dos algoritmos propostos utilizando dois classificadores hierárquicos globais propostos na literatura. Testes estatísticos mostraram que o uso dos métodos de seleção de atributos propostos levaram a um desempenho preditivo consistentemente melhor ou equivalente ao obtido quando todos os atributos iniciais são utilizados, além do benefício de reduzir o número de atributos necessários, o que justifica a aplicação em cenários de classificação hierárquica.Feature selection is a widespread preprocessing step in the data mining field. One of its purposes is to reduce the number of original dataset features to improve a predictive model’s performance. However, despite the benefits of feature selection for the classification task, as far as we are aware, few studies in the literature address feature selection for hierarchical classification context. This work proposes two main supervised hybrid feature selection approaches, combining a filter and a wrapper step, wherein a global model hierarchical classifier evaluates feature subsets. The first uses the General Variable Neighborhood Search metaheuristic and a feature ranking constructed with the Hierarchical Symmetrical Uncertainty measure. The second one proposes an extension of the Correlation-based Feature Selection measure for hierarchical classification and uses a Best First Search algorithm to search the feature subset space. We used twelve datasets from protein and image domains to perform computational experiments to validate the effect of the proposed algorithms on classification performance when using two global hierarchical classifiers proposed in the literature. Statistical tests showed that using our methods as a feature selection led to a predictive performance that is consistently better or equivalent to that obtained using all features, with the benefit of reducing the number of features needed, which justifies their use for the hierarchical classification scenario.Souza, Marcone Jamilson FreitasMerschmann, Luiz Henrique de CamposSouza, Marcone Jamilson FreitasMerschmann, Luiz Henrique de CamposToffolo, Túlio Ângelo MachadoLuz, Eduardo José da SilvaCerri, RicardoBarril Otero, Fernando EstebanLima, Helen de Cássia Sousa da Costa2022-02-24T16:34:56Z2022-02-24T16:34:56Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLIMA, Helen de Cássia Sousa da Costa. Hybrid feature selection approaches using metaheuristics for hierarchical classification. 2021. 71 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2021.http://www.repositorio.ufop.br/jspui/handle/123456789/14546http://creativecommons.org/licenses/by-nc-nd/3.0/us/Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 15/02/2022 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.info:eu-repo/semantics/openAccessengreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOP2024-11-10T16:29:23Zoai:repositorio.ufop.br:123456789/14546Repositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332024-11-10T16:29:23Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false
dc.title.none.fl_str_mv Hybrid feature selection approaches using metaheuristics for hierarchical classification.
title Hybrid feature selection approaches using metaheuristics for hierarchical classification.
spellingShingle Hybrid feature selection approaches using metaheuristics for hierarchical classification.
Lima, Helen de Cássia Sousa da Costa
Classificação
Wrapper
Filtro
Mineração de dados
title_short Hybrid feature selection approaches using metaheuristics for hierarchical classification.
title_full Hybrid feature selection approaches using metaheuristics for hierarchical classification.
title_fullStr Hybrid feature selection approaches using metaheuristics for hierarchical classification.
title_full_unstemmed Hybrid feature selection approaches using metaheuristics for hierarchical classification.
title_sort Hybrid feature selection approaches using metaheuristics for hierarchical classification.
author Lima, Helen de Cássia Sousa da Costa
author_facet Lima, Helen de Cássia Sousa da Costa
author_role author
dc.contributor.none.fl_str_mv Souza, Marcone Jamilson Freitas
Merschmann, Luiz Henrique de Campos
Souza, Marcone Jamilson Freitas
Merschmann, Luiz Henrique de Campos
Toffolo, Túlio Ângelo Machado
Luz, Eduardo José da Silva
Cerri, Ricardo
Barril Otero, Fernando Esteban
dc.contributor.author.fl_str_mv Lima, Helen de Cássia Sousa da Costa
dc.subject.por.fl_str_mv Classificação
Wrapper
Filtro
Mineração de dados
topic Classificação
Wrapper
Filtro
Mineração de dados
description Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
publishDate 2021
dc.date.none.fl_str_mv 2021
2022-02-24T16:34:56Z
2022-02-24T16:34:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv LIMA, Helen de Cássia Sousa da Costa. Hybrid feature selection approaches using metaheuristics for hierarchical classification. 2021. 71 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2021.
http://www.repositorio.ufop.br/jspui/handle/123456789/14546
identifier_str_mv LIMA, Helen de Cássia Sousa da Costa. Hybrid feature selection approaches using metaheuristics for hierarchical classification. 2021. 71 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2021.
url http://www.repositorio.ufop.br/jspui/handle/123456789/14546
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/us/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/us/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFOP
instname:Universidade Federal de Ouro Preto (UFOP)
instacron:UFOP
instname_str Universidade Federal de Ouro Preto (UFOP)
instacron_str UFOP
institution UFOP
reponame_str Repositório Institucional da UFOP
collection Repositório Institucional da UFOP
repository.name.fl_str_mv Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)
repository.mail.fl_str_mv repositorio@ufop.edu.br
_version_ 1823329358665744384