Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes

Detalhes bibliográficos
Autor(a) principal: Arnaldo, Heloína Alves
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/jspui/handle/123456789/18109
Resumo: Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets
id UFRN_9e1915f67240fb2c143c9229fbf387bb
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/18109
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Arnaldo, Heloína Alveshttp://lattes.cnpq.br/5580392803736306http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7Canuto, Anne Magaly de Paulahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8Santiago, Regivan Hugo Nuneshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4Dimuro, Graçaliz Pereirahttp://lattes.cnpq.br/9414212573217453Bedregal, Benjamin René Callejas2014-12-17T15:48:11Z2014-11-262014-12-17T15:48:11Z2014-02-24ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.https://repositorio.ufrn.br/jspui/handle/123456789/18109Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data setsAgrupamento de dados é uma técnica aplicada a diversas áreas como mineração de dados, processamento de imagens e reconhecimento de padrões. Algoritmos de agrupamento particionam um conjunto de dados em grupos, de tal forma, que elementos dentro de um mesmo grupo tenham alto grau de similaridade, enquanto elementos pertencentes a diferentes grupos tenham alto grau de dissimilaridade. O algoritmo Fuzzy C-Means (FCM) é um dos algoritmos de agrupamento fuzzy de dados mais utilizados e discutidos na literatura. O desempenho do FCM é fortemente afetado pela seleção dos centros iniciais dos grupos. Portanto, a escolha de um bom conjunto de centros iniciais é muito importante para o desempenho do algoritmo. No entanto, no FCM, a escolha dos centros iniciais é feita de forma aleatória, tornando difícil encontrar um bom conjunto. Este trabalho propõe três novos métodos para obter os centros iniciais dos grupos, de forma determinística, no algoritmo FCM, e que podem também ser usados em variantes do FCM. Neste trabalho esses métodos de inicialização foram aplicados na variante ckMeans. Com os métodos propostos, pretende-se obter um conjunto de centros iniciais que esteja próximo dos centros reais dos grupos. Com estas novas abordagens de inicialização deseja-se reduzir o número de iterações para estes algoritmos convergirem e o tempo de processamento, sem afetar a qualidade do agrupamento ou até melhorar a qualidade em alguns casos. Neste sentido, foram utilizados índices de validação de agrupamento para medir a qualidade dos agrupamentos obtidos pelos algoritmos FCM e ckMeans, modificados com os métodos de inicialização propostos, quando aplicados a diversas bases de dadosCoordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfporUniversidade Federal do Rio Grande do NortePrograma de Pós-Graduação em Sistemas e ComputaçãoUFRNBRCiência da ComputaçãoAgrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validaçãoData clustering. Fuzzy C-Means. Cluster centers initialization. Validation indicesCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAONovos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALHeloinaAA_DISSERT.pdfapplication/pdf1661373https://repositorio.ufrn.br/bitstream/123456789/18109/1/HeloinaAA_DISSERT.pdfdf9fe39185a27ded472f2f72284acdf6MD51TEXTHeloinaAA_DISSERT.pdf.txtHeloinaAA_DISSERT.pdf.txtExtracted texttext/plain175593https://repositorio.ufrn.br/bitstream/123456789/18109/6/HeloinaAA_DISSERT.pdf.txt47174630d94ff008073bdee28dabbcf7MD56THUMBNAILHeloinaAA_DISSERT.pdf.jpgHeloinaAA_DISSERT.pdf.jpgIM Thumbnailimage/jpeg3298https://repositorio.ufrn.br/bitstream/123456789/18109/7/HeloinaAA_DISSERT.pdf.jpg1f05ddef6e86348127c2622e73d76b6eMD57123456789/181092017-11-04 13:44:22.264oai:https://repositorio.ufrn.br:123456789/18109Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2017-11-04T16:44:22Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.por.fl_str_mv Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
spellingShingle Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
Arnaldo, Heloína Alves
Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação
Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_full Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_fullStr Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_full_unstemmed Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
title_sort Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
author Arnaldo, Heloína Alves
author_facet Arnaldo, Heloína Alves
author_role author
dc.contributor.authorID.por.fl_str_mv
dc.contributor.authorLattes.por.fl_str_mv http://lattes.cnpq.br/5580392803736306
dc.contributor.advisorID.por.fl_str_mv
dc.contributor.advisorLattes.por.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7
dc.contributor.referees1.pt_BR.fl_str_mv Canuto, Anne Magaly de Paula
dc.contributor.referees1ID.por.fl_str_mv
dc.contributor.referees1Lattes.por.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8
dc.contributor.referees2.pt_BR.fl_str_mv Santiago, Regivan Hugo Nunes
dc.contributor.referees2ID.por.fl_str_mv
dc.contributor.referees2Lattes.por.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4
dc.contributor.referees3.pt_BR.fl_str_mv Dimuro, Graçaliz Pereira
dc.contributor.referees3ID.por.fl_str_mv
dc.contributor.referees3Lattes.por.fl_str_mv http://lattes.cnpq.br/9414212573217453
dc.contributor.author.fl_str_mv Arnaldo, Heloína Alves
dc.contributor.advisor1.fl_str_mv Bedregal, Benjamin René Callejas
contributor_str_mv Bedregal, Benjamin René Callejas
dc.subject.por.fl_str_mv Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação
topic Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação
Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.eng.fl_str_mv Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets
publishDate 2014
dc.date.accessioned.fl_str_mv 2014-12-17T15:48:11Z
dc.date.available.fl_str_mv 2014-11-26
2014-12-17T15:48:11Z
dc.date.issued.fl_str_mv 2014-02-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/18109
identifier_str_mv ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.
url https://repositorio.ufrn.br/jspui/handle/123456789/18109
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Sistemas e Computação
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Ciência da Computação
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/18109/1/HeloinaAA_DISSERT.pdf
https://repositorio.ufrn.br/bitstream/123456789/18109/6/HeloinaAA_DISSERT.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/18109/7/HeloinaAA_DISSERT.pdf.jpg
bitstream.checksum.fl_str_mv df9fe39185a27ded472f2f72284acdf6
47174630d94ff008073bdee28dabbcf7
1f05ddef6e86348127c2622e73d76b6e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1797777108681883648