Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética

Detalhes bibliográficos
Autor(a) principal: Fernandes, Everlandio Rebouças Queiroz
Data de Publicação: 2009
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UNIFOR
Texto Completo: https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377
Resumo: Um notável avanço vem sendo recentemente obtido na área de agrupamento de dados mediante o desenvolvimento de métodos de fusão de partições. Essa abordagem, conhecida como clustering ensembles, consiste em combinar os resultados de múltiplos agrupamentos de uma mesma base de dados em uma única partição-consenso. Embora promissora, essa abordagem ainda é restritiva, já que uma única resposta para um problema limita a aquisição do conhecimento que poderia ser obtido considerando outras possíveis soluções (partições). Por outro lado, devido à existência de vários critérios de avaliação da qualidade de agrupamentos, pode-se modelar essa tarefa como um problema típico de otimização multiobjetivo. Nesse contexto, o presente estudo apresenta uma nova abordagem, baseada em programação genética multiobjetivo, que projeta automaticamente novos operadores hierárquicos de fusão de partições. Desse modo, um conjunto inicial de partições, obtido via a aplicação de diferentes técnicas de agrupamento, pode ser continuamente refinado através de uma população de hierarquias de fusores, que selecionam e combinam as partições originais, utilizando diferentes critérios de qualidade como funções-objetivo. Para validar a nova abordagem, em termos de eficiência e eficácia, foi implementado um protótipo e conduzido um estudo comparativo, envolvendo outros algoritmos de agrupamento (dentre os quais três são de clustering ensembles e dois são multiobjetivo), sobre 10 diferentes bases de dados. Os experimentos demonstram que, em geral, a ideia de se ter uma hierarquia de fusores aliada à correta seleção das partições pode proporcionar ganhos significativos em termos de eficácia e robustez. Palavras-chave: Agrupamento de Dados. Clustering Ensembles. Fusão Hierárquica de Partições. Algoritmos Evolutivos Multiobjetivos. Programação Genética.
id UFOR_9f65f4118e267337e431a8b7e3e604f9
oai_identifier_str oai::88377
network_acronym_str UFOR
network_name_str Biblioteca Digital de Teses e Dissertações da UNIFOR
repository_id_str
spelling Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genéticaAlgorítmos genéticosProgramação genéticaUm notável avanço vem sendo recentemente obtido na área de agrupamento de dados mediante o desenvolvimento de métodos de fusão de partições. Essa abordagem, conhecida como clustering ensembles, consiste em combinar os resultados de múltiplos agrupamentos de uma mesma base de dados em uma única partição-consenso. Embora promissora, essa abordagem ainda é restritiva, já que uma única resposta para um problema limita a aquisição do conhecimento que poderia ser obtido considerando outras possíveis soluções (partições). Por outro lado, devido à existência de vários critérios de avaliação da qualidade de agrupamentos, pode-se modelar essa tarefa como um problema típico de otimização multiobjetivo. Nesse contexto, o presente estudo apresenta uma nova abordagem, baseada em programação genética multiobjetivo, que projeta automaticamente novos operadores hierárquicos de fusão de partições. Desse modo, um conjunto inicial de partições, obtido via a aplicação de diferentes técnicas de agrupamento, pode ser continuamente refinado através de uma população de hierarquias de fusores, que selecionam e combinam as partições originais, utilizando diferentes critérios de qualidade como funções-objetivo. Para validar a nova abordagem, em termos de eficiência e eficácia, foi implementado um protótipo e conduzido um estudo comparativo, envolvendo outros algoritmos de agrupamento (dentre os quais três são de clustering ensembles e dois são multiobjetivo), sobre 10 diferentes bases de dados. Os experimentos demonstram que, em geral, a ideia de se ter uma hierarquia de fusores aliada à correta seleção das partições pode proporcionar ganhos significativos em termos de eficácia e robustez. Palavras-chave: Agrupamento de Dados. Clustering Ensembles. Fusão Hierárquica de Partições. Algoritmos Evolutivos Multiobjetivos. Programação Genética.A remarkable progress has been recently achieved in the area of data clustering, in part due to the development of clustering ensemble methods. In a nutshell, this approach aims at combining multiple partitions produced over the same dataset into a single consensus partition. Although promising, this approach is still restrictive in the sense that obtaining a single solution (partition) as result limits the knowledge that could be grasped from the data, which could contain several meaningful alternative solutions. On the other hand, there exist several validation criteria to assess the data partitions, each considering a distinct viewpoint. This permits to model the data clustering task as a typical multiobjective optimization problem. This strategy, which has also gained much attention in the last years, is known as multiobjective clustering. In this context, this study presents a novel hybrid approach, based on multiobjective genetic programming, aiming at the automatic design of novel hierarchical fusion operators for clustering ensembles. By this means, an initial set of partitions obtained via the application of different clustering techniques could be continuously refined through a population of hierarchies of fusion operators, which select and combine the original partitions, using different quality criteria as objective functions. To validate the new approach in terms of efficiency and effectiveness, we have implemented a prototype and conducted a comparative study including other clustering algorithms (three of which are of clustering ensembles and two are multiobjective in nature) over 10 different datasets. The experiments indicate that, in general, the idea of having a fusion hierarchy together with the correct selection of the data partitions can provide significant gains in terms of effectiveness and robustness. Keywords: Data Clustering. Clustering Ensembles. Hierarchical Fusion. Multiobjective Evolutionary Algorithms, Genetic Programming.Coelho, Andre Luis VasconcelosCoelho, Andre Luis VasconcelosFaceli, KattiSantos, Rafael Duarte Coelho dosSantos, Cícero Nogueira dosUniversidade de FortalezaFernandes, Everlandio Rebouças Queiroz2009info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377https://uol.unifor.br/auth-sophia/exibicao/6240Disponibilidade forma física: Existe obra impressa de código: 83630porreponame:Biblioteca Digital de Teses e Dissertações da UNIFORinstname:Universidade de Fortaleza (UNIFOR)instacron:UNIFORinfo:eu-repo/semantics/openAccess1899-12-30T00:00:00Zoai::88377Biblioteca Digital de Teses e Dissertaçõeshttps://www.unifor.br/bdtdONGhttp://dspace.unifor.br/oai/requestbib@unifor.br||bib@unifor.bropendoar:1899-12-30T00:00Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)false
dc.title.none.fl_str_mv Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
title Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
spellingShingle Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
Fernandes, Everlandio Rebouças Queiroz
Algorítmos genéticos
Programação genética
title_short Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
title_full Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
title_fullStr Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
title_full_unstemmed Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
title_sort Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
author Fernandes, Everlandio Rebouças Queiroz
author_facet Fernandes, Everlandio Rebouças Queiroz
author_role author
dc.contributor.none.fl_str_mv Coelho, Andre Luis Vasconcelos
Coelho, Andre Luis Vasconcelos
Faceli, Katti
Santos, Rafael Duarte Coelho dos
Santos, Cícero Nogueira dos
Universidade de Fortaleza
dc.contributor.author.fl_str_mv Fernandes, Everlandio Rebouças Queiroz
dc.subject.por.fl_str_mv Algorítmos genéticos
Programação genética
topic Algorítmos genéticos
Programação genética
description Um notável avanço vem sendo recentemente obtido na área de agrupamento de dados mediante o desenvolvimento de métodos de fusão de partições. Essa abordagem, conhecida como clustering ensembles, consiste em combinar os resultados de múltiplos agrupamentos de uma mesma base de dados em uma única partição-consenso. Embora promissora, essa abordagem ainda é restritiva, já que uma única resposta para um problema limita a aquisição do conhecimento que poderia ser obtido considerando outras possíveis soluções (partições). Por outro lado, devido à existência de vários critérios de avaliação da qualidade de agrupamentos, pode-se modelar essa tarefa como um problema típico de otimização multiobjetivo. Nesse contexto, o presente estudo apresenta uma nova abordagem, baseada em programação genética multiobjetivo, que projeta automaticamente novos operadores hierárquicos de fusão de partições. Desse modo, um conjunto inicial de partições, obtido via a aplicação de diferentes técnicas de agrupamento, pode ser continuamente refinado através de uma população de hierarquias de fusores, que selecionam e combinam as partições originais, utilizando diferentes critérios de qualidade como funções-objetivo. Para validar a nova abordagem, em termos de eficiência e eficácia, foi implementado um protótipo e conduzido um estudo comparativo, envolvendo outros algoritmos de agrupamento (dentre os quais três são de clustering ensembles e dois são multiobjetivo), sobre 10 diferentes bases de dados. Os experimentos demonstram que, em geral, a ideia de se ter uma hierarquia de fusores aliada à correta seleção das partições pode proporcionar ganhos significativos em termos de eficácia e robustez. Palavras-chave: Agrupamento de Dados. Clustering Ensembles. Fusão Hierárquica de Partições. Algoritmos Evolutivos Multiobjetivos. Programação Genética.
publishDate 2009
dc.date.none.fl_str_mv 2009
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377
url https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://uol.unifor.br/auth-sophia/exibicao/6240
Disponibilidade forma física: Existe obra impressa de código: 83630
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR
instname:Universidade de Fortaleza (UNIFOR)
instacron:UNIFOR
instname_str Universidade de Fortaleza (UNIFOR)
instacron_str UNIFOR
institution UNIFOR
reponame_str Biblioteca Digital de Teses e Dissertações da UNIFOR
collection Biblioteca Digital de Teses e Dissertações da UNIFOR
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)
repository.mail.fl_str_mv bib@unifor.br||bib@unifor.br
_version_ 1800408696182800384