Algoritmo de enxame de partículas ensemble para clusterização de dados

Detalhes bibliográficos
Autor(a) principal: Coelho, Rodrigo Amador
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFLA
Texto Completo: http://repositorio.ufla.br/jspui/handle/1/2684
Resumo: Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.
id UFLA_d76f2c7c63806687f80ad25e029039db
oai_identifier_str oai:localhost:1/2684
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling Algoritmo de enxame de partículas ensemble para clusterização de dadosParticle swarm ensemble algorithm for data clusteringParticle swarm optimizationClusterizaçãoEnsembleFunção de consensoClusteringConsensus functionCNPQ_NÃO_INFORMADODissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG)Inteligência Computacional e Processamento GráficoClustering is an important task in data mining and has been used by many researchers in different areas. The cluster ensemble method uses several results of different clustering algorithms at a consensus solution to improve the quality and robustness of the results. Generally built in two phases, in the first stage the cluster ensemble is comprised of a set of algorithms that receive the database and has as output a set of clusters as a solution. The second stage receives the set of clusters as input and combines them through a consensus function producing final clusters. Considered a precise and robust alternative compared individual clustering algorithms, the clustering ensemble improves result using the possibility of compensating errors committed by some clustering algorithms for intervention of other correct solution. One of the major challenges beyond the consensus function is to determine the best structure of the data set that will be used by the function consensus. In this work, the Particle Swarm Optimization algorithm (PSO) is proposed as a clustering algorithm for the first phase of the ensemble and as a consensus function in the second phase. Different similarity measures and two types of database structures serve as input to the consensus function. Three sets of experiments were performed to investigate the behavior of PSO in a cluster ensemble. One of the experiments involves the application of PSO in an ensemble in order to predict defects in software quality. At the end of the empirical study, the PSO clustering ensemble was able to produce as good or better results even when using two different structures from databases.Clusterização é uma importante tarefa na mineração de dados e tem sido utilizada por muitos pesquisadores em diferentes áreas. O método do ensemble de clusters utiliza de vários resultados de diferentes algoritmos de clusterização em uma solução de consenso para melhorar a qualidade e solidez dos resultados. Geralmente construído de duas fases, o ensemble de clusters, em sua primeira fase é composto de um conjunto de algoritmos que recebe a base de dados e tem como saída um conjunto de clusters como solução. A segunda fase recebe o conjunto de clusters como entrada e as combina por meio de uma função de consenso produzindo clusters finais. Considerado uma alternativa robusta e precisa, frente a algoritmos individuais de clusterização, o ensemble de clusters melhora o resultado compensando a possibilidade de erros cometidos por alguns algoritmos de clusterização pela intervenção da solução correta de outros. Um dos maiores desafios, além da função de consenso, é determinar a melhor estrutura da base de dados que será usada pela função de consenso. Nesse trabalho, o algoritmo Particle Swarm Optimization (PSO) é proposto como algoritmo de clusterização para a primeira fase do ensemble e como função de consenso na segunda fase. Diferentes medidas de similaridade foram utilizadas, além de dois tipos de estruturas de base de dados, que servirão como entrada para a função de consenso. Foram realizadas três baterias de experimentos a fim de investigar o comportamento do PSO em um ensemble de clusters. Um dos experimentos realizados consiste na aplicação do PSO em um ensemble a fim de predizer defeitos em software. Ao fim do estudo empírico, o ensemble de clusters com o PSO foi capaz de produzir resultados tão bons ou melhores, nas duas diferentes estruturas de bases de dados.UNIVERSIDADE FEDERAL DE LAVRASDCC - Programa de Pós-graduaçãoUFLABRASILEsmin, Ahmed Ali AbdallaMoraes, Carlos H. Valério dePereira, Denilson AlvesCoelho, Rodrigo Amador2014-08-13T15:32:34Z2014-08-13T15:32:34Z2014-08-132014-02-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfCOELHO, R. A. Algoritmo de enxame de partículas ensemble para clusterização de dados. 2014. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.http://repositorio.ufla.br/jspui/handle/1/2684info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2023-04-13T18:10:42Zoai:localhost:1/2684Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2023-04-13T18:10:42Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false
dc.title.none.fl_str_mv Algoritmo de enxame de partículas ensemble para clusterização de dados
Particle swarm ensemble algorithm for data clustering
title Algoritmo de enxame de partículas ensemble para clusterização de dados
spellingShingle Algoritmo de enxame de partículas ensemble para clusterização de dados
Coelho, Rodrigo Amador
Particle swarm optimization
Clusterização
Ensemble
Função de consenso
Clustering
Consensus function
CNPQ_NÃO_INFORMADO
title_short Algoritmo de enxame de partículas ensemble para clusterização de dados
title_full Algoritmo de enxame de partículas ensemble para clusterização de dados
title_fullStr Algoritmo de enxame de partículas ensemble para clusterização de dados
title_full_unstemmed Algoritmo de enxame de partículas ensemble para clusterização de dados
title_sort Algoritmo de enxame de partículas ensemble para clusterização de dados
author Coelho, Rodrigo Amador
author_facet Coelho, Rodrigo Amador
author_role author
dc.contributor.none.fl_str_mv Esmin, Ahmed Ali Abdalla
Moraes, Carlos H. Valério de
Pereira, Denilson Alves
dc.contributor.author.fl_str_mv Coelho, Rodrigo Amador
dc.subject.por.fl_str_mv Particle swarm optimization
Clusterização
Ensemble
Função de consenso
Clustering
Consensus function
CNPQ_NÃO_INFORMADO
topic Particle swarm optimization
Clusterização
Ensemble
Função de consenso
Clustering
Consensus function
CNPQ_NÃO_INFORMADO
description Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.
publishDate 2014
dc.date.none.fl_str_mv 2014-08-13T15:32:34Z
2014-08-13T15:32:34Z
2014-08-13
2014-02-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv COELHO, R. A. Algoritmo de enxame de partículas ensemble para clusterização de dados. 2014. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.
http://repositorio.ufla.br/jspui/handle/1/2684
identifier_str_mv COELHO, R. A. Algoritmo de enxame de partículas ensemble para clusterização de dados. 2014. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.
url http://repositorio.ufla.br/jspui/handle/1/2684
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
DCC - Programa de Pós-graduação
UFLA
BRASIL
publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
DCC - Programa de Pós-graduação
UFLA
BRASIL
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1784550208111116288