Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/jspui/handle/123456789/18109 |
Resumo: | Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets |
id |
UFRN_9e1915f67240fb2c143c9229fbf387bb |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/18109 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Arnaldo, Heloína Alveshttp://lattes.cnpq.br/5580392803736306http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7Canuto, Anne Magaly de Paulahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8Santiago, Regivan Hugo Nuneshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4Dimuro, Graçaliz Pereirahttp://lattes.cnpq.br/9414212573217453Bedregal, Benjamin René Callejas2014-12-17T15:48:11Z2014-11-262014-12-17T15:48:11Z2014-02-24ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.https://repositorio.ufrn.br/jspui/handle/123456789/18109Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data setsAgrupamento de dados é uma técnica aplicada a diversas áreas como mineração de dados, processamento de imagens e reconhecimento de padrões. Algoritmos de agrupamento particionam um conjunto de dados em grupos, de tal forma, que elementos dentro de um mesmo grupo tenham alto grau de similaridade, enquanto elementos pertencentes a diferentes grupos tenham alto grau de dissimilaridade. O algoritmo Fuzzy C-Means (FCM) é um dos algoritmos de agrupamento fuzzy de dados mais utilizados e discutidos na literatura. O desempenho do FCM é fortemente afetado pela seleção dos centros iniciais dos grupos. Portanto, a escolha de um bom conjunto de centros iniciais é muito importante para o desempenho do algoritmo. No entanto, no FCM, a escolha dos centros iniciais é feita de forma aleatória, tornando difícil encontrar um bom conjunto. Este trabalho propõe três novos métodos para obter os centros iniciais dos grupos, de forma determinística, no algoritmo FCM, e que podem também ser usados em variantes do FCM. Neste trabalho esses métodos de inicialização foram aplicados na variante ckMeans. Com os métodos propostos, pretende-se obter um conjunto de centros iniciais que esteja próximo dos centros reais dos grupos. Com estas novas abordagens de inicialização deseja-se reduzir o número de iterações para estes algoritmos convergirem e o tempo de processamento, sem afetar a qualidade do agrupamento ou até melhorar a qualidade em alguns casos. Neste sentido, foram utilizados índices de validação de agrupamento para medir a qualidade dos agrupamentos obtidos pelos algoritmos FCM e ckMeans, modificados com os métodos de inicialização propostos, quando aplicados a diversas bases de dadosCoordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfporUniversidade Federal do Rio Grande do NortePrograma de Pós-Graduação em Sistemas e ComputaçãoUFRNBRCiência da ComputaçãoAgrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validaçãoData clustering. Fuzzy C-Means. Cluster centers initialization. Validation indicesCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAONovos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALHeloinaAA_DISSERT.pdfapplication/pdf1661373https://repositorio.ufrn.br/bitstream/123456789/18109/1/HeloinaAA_DISSERT.pdfdf9fe39185a27ded472f2f72284acdf6MD51TEXTHeloinaAA_DISSERT.pdf.txtHeloinaAA_DISSERT.pdf.txtExtracted texttext/plain175593https://repositorio.ufrn.br/bitstream/123456789/18109/6/HeloinaAA_DISSERT.pdf.txt47174630d94ff008073bdee28dabbcf7MD56THUMBNAILHeloinaAA_DISSERT.pdf.jpgHeloinaAA_DISSERT.pdf.jpgIM Thumbnailimage/jpeg3298https://repositorio.ufrn.br/bitstream/123456789/18109/7/HeloinaAA_DISSERT.pdf.jpg1f05ddef6e86348127c2622e73d76b6eMD57123456789/181092017-11-04 13:44:22.264oai:https://repositorio.ufrn.br:123456789/18109Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2017-11-04T16:44:22Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.por.fl_str_mv |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes |
title |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes |
spellingShingle |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes Arnaldo, Heloína Alves Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
title_short |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes |
title_full |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes |
title_fullStr |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes |
title_full_unstemmed |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes |
title_sort |
Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes |
author |
Arnaldo, Heloína Alves |
author_facet |
Arnaldo, Heloína Alves |
author_role |
author |
dc.contributor.authorID.por.fl_str_mv |
|
dc.contributor.authorLattes.por.fl_str_mv |
http://lattes.cnpq.br/5580392803736306 |
dc.contributor.advisorID.por.fl_str_mv |
|
dc.contributor.advisorLattes.por.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7 |
dc.contributor.referees1.pt_BR.fl_str_mv |
Canuto, Anne Magaly de Paula |
dc.contributor.referees1ID.por.fl_str_mv |
|
dc.contributor.referees1Lattes.por.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8 |
dc.contributor.referees2.pt_BR.fl_str_mv |
Santiago, Regivan Hugo Nunes |
dc.contributor.referees2ID.por.fl_str_mv |
|
dc.contributor.referees2Lattes.por.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4 |
dc.contributor.referees3.pt_BR.fl_str_mv |
Dimuro, Graçaliz Pereira |
dc.contributor.referees3ID.por.fl_str_mv |
|
dc.contributor.referees3Lattes.por.fl_str_mv |
http://lattes.cnpq.br/9414212573217453 |
dc.contributor.author.fl_str_mv |
Arnaldo, Heloína Alves |
dc.contributor.advisor1.fl_str_mv |
Bedregal, Benjamin René Callejas |
contributor_str_mv |
Bedregal, Benjamin René Callejas |
dc.subject.por.fl_str_mv |
Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação |
topic |
Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
dc.subject.eng.fl_str_mv |
Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
description |
Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets |
publishDate |
2014 |
dc.date.accessioned.fl_str_mv |
2014-12-17T15:48:11Z |
dc.date.available.fl_str_mv |
2014-11-26 2014-12-17T15:48:11Z |
dc.date.issued.fl_str_mv |
2014-02-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/jspui/handle/123456789/18109 |
identifier_str_mv |
ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014. |
url |
https://repositorio.ufrn.br/jspui/handle/123456789/18109 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Sistemas e Computação |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Ciência da Computação |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/18109/1/HeloinaAA_DISSERT.pdf https://repositorio.ufrn.br/bitstream/123456789/18109/6/HeloinaAA_DISSERT.pdf.txt https://repositorio.ufrn.br/bitstream/123456789/18109/7/HeloinaAA_DISSERT.pdf.jpg |
bitstream.checksum.fl_str_mv |
df9fe39185a27ded472f2f72284acdf6 47174630d94ff008073bdee28dabbcf7 1f05ddef6e86348127c2622e73d76b6e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1797777108681883648 |