Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética
Autor(a) principal: | |
---|---|
Data de Publicação: | 2009 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UNIFOR |
Texto Completo: | https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377 |
Resumo: | Um notável avanço vem sendo recentemente obtido na área de agrupamento de dados mediante o desenvolvimento de métodos de fusão de partições. Essa abordagem, conhecida como clustering ensembles, consiste em combinar os resultados de múltiplos agrupamentos de uma mesma base de dados em uma única partição-consenso. Embora promissora, essa abordagem ainda é restritiva, já que uma única resposta para um problema limita a aquisição do conhecimento que poderia ser obtido considerando outras possíveis soluções (partições). Por outro lado, devido à existência de vários critérios de avaliação da qualidade de agrupamentos, pode-se modelar essa tarefa como um problema típico de otimização multiobjetivo. Nesse contexto, o presente estudo apresenta uma nova abordagem, baseada em programação genética multiobjetivo, que projeta automaticamente novos operadores hierárquicos de fusão de partições. Desse modo, um conjunto inicial de partições, obtido via a aplicação de diferentes técnicas de agrupamento, pode ser continuamente refinado através de uma população de hierarquias de fusores, que selecionam e combinam as partições originais, utilizando diferentes critérios de qualidade como funções-objetivo. Para validar a nova abordagem, em termos de eficiência e eficácia, foi implementado um protótipo e conduzido um estudo comparativo, envolvendo outros algoritmos de agrupamento (dentre os quais três são de clustering ensembles e dois são multiobjetivo), sobre 10 diferentes bases de dados. Os experimentos demonstram que, em geral, a ideia de se ter uma hierarquia de fusores aliada à correta seleção das partições pode proporcionar ganhos significativos em termos de eficácia e robustez. Palavras-chave: Agrupamento de Dados. Clustering Ensembles. Fusão Hierárquica de Partições. Algoritmos Evolutivos Multiobjetivos. Programação Genética. |
id |
UFOR_9f65f4118e267337e431a8b7e3e604f9 |
---|---|
oai_identifier_str |
oai::88377 |
network_acronym_str |
UFOR |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UNIFOR |
repository_id_str |
|
spelling |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genéticaAlgorítmos genéticosProgramação genéticaUm notável avanço vem sendo recentemente obtido na área de agrupamento de dados mediante o desenvolvimento de métodos de fusão de partições. Essa abordagem, conhecida como clustering ensembles, consiste em combinar os resultados de múltiplos agrupamentos de uma mesma base de dados em uma única partição-consenso. Embora promissora, essa abordagem ainda é restritiva, já que uma única resposta para um problema limita a aquisição do conhecimento que poderia ser obtido considerando outras possíveis soluções (partições). Por outro lado, devido à existência de vários critérios de avaliação da qualidade de agrupamentos, pode-se modelar essa tarefa como um problema típico de otimização multiobjetivo. Nesse contexto, o presente estudo apresenta uma nova abordagem, baseada em programação genética multiobjetivo, que projeta automaticamente novos operadores hierárquicos de fusão de partições. Desse modo, um conjunto inicial de partições, obtido via a aplicação de diferentes técnicas de agrupamento, pode ser continuamente refinado através de uma população de hierarquias de fusores, que selecionam e combinam as partições originais, utilizando diferentes critérios de qualidade como funções-objetivo. Para validar a nova abordagem, em termos de eficiência e eficácia, foi implementado um protótipo e conduzido um estudo comparativo, envolvendo outros algoritmos de agrupamento (dentre os quais três são de clustering ensembles e dois são multiobjetivo), sobre 10 diferentes bases de dados. Os experimentos demonstram que, em geral, a ideia de se ter uma hierarquia de fusores aliada à correta seleção das partições pode proporcionar ganhos significativos em termos de eficácia e robustez. Palavras-chave: Agrupamento de Dados. Clustering Ensembles. Fusão Hierárquica de Partições. Algoritmos Evolutivos Multiobjetivos. Programação Genética.A remarkable progress has been recently achieved in the area of data clustering, in part due to the development of clustering ensemble methods. In a nutshell, this approach aims at combining multiple partitions produced over the same dataset into a single consensus partition. Although promising, this approach is still restrictive in the sense that obtaining a single solution (partition) as result limits the knowledge that could be grasped from the data, which could contain several meaningful alternative solutions. On the other hand, there exist several validation criteria to assess the data partitions, each considering a distinct viewpoint. This permits to model the data clustering task as a typical multiobjective optimization problem. This strategy, which has also gained much attention in the last years, is known as multiobjective clustering. In this context, this study presents a novel hybrid approach, based on multiobjective genetic programming, aiming at the automatic design of novel hierarchical fusion operators for clustering ensembles. By this means, an initial set of partitions obtained via the application of different clustering techniques could be continuously refined through a population of hierarchies of fusion operators, which select and combine the original partitions, using different quality criteria as objective functions. To validate the new approach in terms of efficiency and effectiveness, we have implemented a prototype and conducted a comparative study including other clustering algorithms (three of which are of clustering ensembles and two are multiobjective in nature) over 10 different datasets. The experiments indicate that, in general, the idea of having a fusion hierarchy together with the correct selection of the data partitions can provide significant gains in terms of effectiveness and robustness. Keywords: Data Clustering. Clustering Ensembles. Hierarchical Fusion. Multiobjective Evolutionary Algorithms, Genetic Programming.Coelho, Andre Luis VasconcelosCoelho, Andre Luis VasconcelosFaceli, KattiSantos, Rafael Duarte Coelho dosSantos, Cícero Nogueira dosUniversidade de FortalezaFernandes, Everlandio Rebouças Queiroz2009info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377https://uol.unifor.br/auth-sophia/exibicao/6240Disponibilidade forma física: Existe obra impressa de código: 83630porreponame:Biblioteca Digital de Teses e Dissertações da UNIFORinstname:Universidade de Fortaleza (UNIFOR)instacron:UNIFORinfo:eu-repo/semantics/openAccess1899-12-30T00:00:00Zoai::88377Biblioteca Digital de Teses e Dissertaçõeshttps://www.unifor.br/bdtdONGhttp://dspace.unifor.br/oai/requestbib@unifor.br||bib@unifor.bropendoar:1899-12-30T00:00Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)false |
dc.title.none.fl_str_mv |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética |
title |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética |
spellingShingle |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética Fernandes, Everlandio Rebouças Queiroz Algorítmos genéticos Programação genética |
title_short |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética |
title_full |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética |
title_fullStr |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética |
title_full_unstemmed |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética |
title_sort |
Projeto multiobjetivo de fusores hierárquicos de partições de dados via programação genética |
author |
Fernandes, Everlandio Rebouças Queiroz |
author_facet |
Fernandes, Everlandio Rebouças Queiroz |
author_role |
author |
dc.contributor.none.fl_str_mv |
Coelho, Andre Luis Vasconcelos Coelho, Andre Luis Vasconcelos Faceli, Katti Santos, Rafael Duarte Coelho dos Santos, Cícero Nogueira dos Universidade de Fortaleza |
dc.contributor.author.fl_str_mv |
Fernandes, Everlandio Rebouças Queiroz |
dc.subject.por.fl_str_mv |
Algorítmos genéticos Programação genética |
topic |
Algorítmos genéticos Programação genética |
description |
Um notável avanço vem sendo recentemente obtido na área de agrupamento de dados mediante o desenvolvimento de métodos de fusão de partições. Essa abordagem, conhecida como clustering ensembles, consiste em combinar os resultados de múltiplos agrupamentos de uma mesma base de dados em uma única partição-consenso. Embora promissora, essa abordagem ainda é restritiva, já que uma única resposta para um problema limita a aquisição do conhecimento que poderia ser obtido considerando outras possíveis soluções (partições). Por outro lado, devido à existência de vários critérios de avaliação da qualidade de agrupamentos, pode-se modelar essa tarefa como um problema típico de otimização multiobjetivo. Nesse contexto, o presente estudo apresenta uma nova abordagem, baseada em programação genética multiobjetivo, que projeta automaticamente novos operadores hierárquicos de fusão de partições. Desse modo, um conjunto inicial de partições, obtido via a aplicação de diferentes técnicas de agrupamento, pode ser continuamente refinado através de uma população de hierarquias de fusores, que selecionam e combinam as partições originais, utilizando diferentes critérios de qualidade como funções-objetivo. Para validar a nova abordagem, em termos de eficiência e eficácia, foi implementado um protótipo e conduzido um estudo comparativo, envolvendo outros algoritmos de agrupamento (dentre os quais três são de clustering ensembles e dois são multiobjetivo), sobre 10 diferentes bases de dados. Os experimentos demonstram que, em geral, a ideia de se ter uma hierarquia de fusores aliada à correta seleção das partições pode proporcionar ganhos significativos em termos de eficácia e robustez. Palavras-chave: Agrupamento de Dados. Clustering Ensembles. Fusão Hierárquica de Partições. Algoritmos Evolutivos Multiobjetivos. Programação Genética. |
publishDate |
2009 |
dc.date.none.fl_str_mv |
2009 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377 |
url |
https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/88377 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://uol.unifor.br/auth-sophia/exibicao/6240 Disponibilidade forma física: Existe obra impressa de código: 83630 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR instname:Universidade de Fortaleza (UNIFOR) instacron:UNIFOR |
instname_str |
Universidade de Fortaleza (UNIFOR) |
instacron_str |
UNIFOR |
institution |
UNIFOR |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UNIFOR |
collection |
Biblioteca Digital de Teses e Dissertações da UNIFOR |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR) |
repository.mail.fl_str_mv |
bib@unifor.br||bib@unifor.br |
_version_ |
1800408696182800384 |