Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais

Detalhes bibliográficos
Autor(a) principal: Silva, Huliane Medeiros da
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/46634
Resumo: O agrupamento de dados consiste em agrupar objetos semelhantes de acordo com alguma característica. Na literatura, existem diversos algoritmos de agrupamento, dentre os quais destaca-se o algoritmo Fuzzy C-Means (FCM), um dos mais discutidos e utilizados em diferentes aplicações. Embora seja um método de agrupamento simples e fácil de manipular, o algoritmo FCM requer como parâmetro inicial o número de grupos. No geral, essa informação é desconhecida, a priori, e se torna um problema relevante no processo de análise de agrupamento de dados. Além disso, o desenho do algoritmo FCM depende fortemente da seleção dos centros iniciais dos grupos. Normalmente, a escolha do conjunto de centros iniciais é feita aleatoriamente, o que pode comprometer o desempenho do FCM e, consequentemente, o processo de análise de agrupamento. Neste contexto, este trabalho propõe uma nova metodologia pra determinar o número de grupos e o conjunto de centros iniciais de algoritmos particionais, usando como estudo de caso o algoritmo FCM e algumas de suas variantes. A ideia é usar um subconjunto dos dados originais para definir o número de grupos e determinar o conjunto de centros iniciais através de um método baseado em funções do tipo média. Com essa nova metodologia, pretende-se reduzir os efeitos colaterais da fase de definição de grupos, possivelmente tornando mais rápido o tempo de processamento e diminuindo o custo computacional. Para avaliar a metodologia proposta, serão utilizados diferentes índices de validação de agrupamento, capazes de avaliar a qualidade dos agrupamentos obtidos pelo algoritmo FCM e algumas de suas variantes, quando aplicados a diferentes bases de dados.
id UFRN_4f5c536d2f87be385b869047fd77b724
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/46634
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Silva, Huliane Medeiros dahttp://lattes.cnpq.br/1797223363490431http://lattes.cnpq.br/4601263005352005Canuto, Anne Magaly de Paula66487099449http://lattes.cnpq.br/1357887401899097Santos, Araken de Medeiroshttp://lattes.cnpq.br/8059198436766378Dimuro, Graçaliz Pereirahttp://lattes.cnpq.br/9414212573217453Moura, Ronildo Pinheiro de Araújohttp://lattes.cnpq.br/8664977292629302Bedregal, Benjamin Rene Callejas2022-03-21T16:17:36Z2022-03-21T16:17:36Z2021-02-05SILVA, Huliane Medeiros da. Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais. 2021. 100f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/46634O agrupamento de dados consiste em agrupar objetos semelhantes de acordo com alguma característica. Na literatura, existem diversos algoritmos de agrupamento, dentre os quais destaca-se o algoritmo Fuzzy C-Means (FCM), um dos mais discutidos e utilizados em diferentes aplicações. Embora seja um método de agrupamento simples e fácil de manipular, o algoritmo FCM requer como parâmetro inicial o número de grupos. No geral, essa informação é desconhecida, a priori, e se torna um problema relevante no processo de análise de agrupamento de dados. Além disso, o desenho do algoritmo FCM depende fortemente da seleção dos centros iniciais dos grupos. Normalmente, a escolha do conjunto de centros iniciais é feita aleatoriamente, o que pode comprometer o desempenho do FCM e, consequentemente, o processo de análise de agrupamento. Neste contexto, este trabalho propõe uma nova metodologia pra determinar o número de grupos e o conjunto de centros iniciais de algoritmos particionais, usando como estudo de caso o algoritmo FCM e algumas de suas variantes. A ideia é usar um subconjunto dos dados originais para definir o número de grupos e determinar o conjunto de centros iniciais através de um método baseado em funções do tipo média. Com essa nova metodologia, pretende-se reduzir os efeitos colaterais da fase de definição de grupos, possivelmente tornando mais rápido o tempo de processamento e diminuindo o custo computacional. Para avaliar a metodologia proposta, serão utilizados diferentes índices de validação de agrupamento, capazes de avaliar a qualidade dos agrupamentos obtidos pelo algoritmo FCM e algumas de suas variantes, quando aplicados a diferentes bases de dados.Data clustering consists of grouping similar objects according to some characteristic. In literature, there are several clustering algorithms, among which stands out the Fuzzy CMeans (FCM), one of the most discussed algorithms, being used in different applications. Although it is a simple and easy to manipulate clustering method, the FCM requires as its initial parameter the number of clusters. Usually, this information is unknown, beforehand and this becomes a relevant problem in the data cluster analysis process. Moreover, the design of the FCM algorithm strongly depends on the selection of the initial centers of the clusters. In general, the selection of the initial set of centers is random, which may compromise the performance of the FCM and, consequently, of the cluster analysis process. In this context, this work proposes a new methodology to determine the number of clusters and the set of initial centers of the partial algorithms, using the FCM algorithm and some of its variants as a case study. The idea is to use a subset of the original data to define the number of clusters and determine the set of initial centers through a method based on mean type functions. With this new methodology, we intend to reduce the side effects of the clusters definition phase, possibly speeding up the processing time and decreasing the computational cost. To evaluate the proposed methodology, different cluster validation indices will be used to evaluate the quality of the clusters obtained by the FCM algorithms and some of its variants, when applied to different databases.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOUFRNBrasilComputaçãoAgrupamento de dadosNúmero de gruposFuzzy C-MeansCentros iniciaisUma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionaisA methodology for defining the number of clusters and the set of initial centers for partitions algorithmsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALMetodologiadefinicaonumero_Silva_2021.pdfapplication/pdf1706739https://repositorio.ufrn.br/bitstream/123456789/46634/1/Metodologiadefinicaonumero_Silva_2021.pdfbb6a1a3f3334f3a7e73ac8d39dc676e5MD51123456789/466342022-05-02 13:01:42.029oai:https://repositorio.ufrn.br:123456789/46634Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-05-02T16:01:42Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
dc.title.alternative.pt_BR.fl_str_mv A methodology for defining the number of clusters and the set of initial centers for partitions algorithms
title Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
spellingShingle Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
Silva, Huliane Medeiros da
Computação
Agrupamento de dados
Número de grupos
Fuzzy C-Means
Centros iniciais
title_short Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
title_full Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
title_fullStr Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
title_full_unstemmed Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
title_sort Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais
author Silva, Huliane Medeiros da
author_facet Silva, Huliane Medeiros da
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1797223363490431
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4601263005352005
dc.contributor.referees1.none.fl_str_mv Santos, Araken de Medeiros
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8059198436766378
dc.contributor.referees2.none.fl_str_mv Dimuro, Graçaliz Pereira
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9414212573217453
dc.contributor.referees3.none.fl_str_mv Moura, Ronildo Pinheiro de Araújo
dc.contributor.referees3Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/8664977292629302
dc.contributor.author.fl_str_mv Silva, Huliane Medeiros da
dc.contributor.advisor-co1.fl_str_mv Canuto, Anne Magaly de Paula
dc.contributor.advisor-co1ID.fl_str_mv 66487099449
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/1357887401899097
dc.contributor.advisor1.fl_str_mv Bedregal, Benjamin Rene Callejas
contributor_str_mv Canuto, Anne Magaly de Paula
Bedregal, Benjamin Rene Callejas
dc.subject.por.fl_str_mv Computação
Agrupamento de dados
Número de grupos
Fuzzy C-Means
Centros iniciais
topic Computação
Agrupamento de dados
Número de grupos
Fuzzy C-Means
Centros iniciais
description O agrupamento de dados consiste em agrupar objetos semelhantes de acordo com alguma característica. Na literatura, existem diversos algoritmos de agrupamento, dentre os quais destaca-se o algoritmo Fuzzy C-Means (FCM), um dos mais discutidos e utilizados em diferentes aplicações. Embora seja um método de agrupamento simples e fácil de manipular, o algoritmo FCM requer como parâmetro inicial o número de grupos. No geral, essa informação é desconhecida, a priori, e se torna um problema relevante no processo de análise de agrupamento de dados. Além disso, o desenho do algoritmo FCM depende fortemente da seleção dos centros iniciais dos grupos. Normalmente, a escolha do conjunto de centros iniciais é feita aleatoriamente, o que pode comprometer o desempenho do FCM e, consequentemente, o processo de análise de agrupamento. Neste contexto, este trabalho propõe uma nova metodologia pra determinar o número de grupos e o conjunto de centros iniciais de algoritmos particionais, usando como estudo de caso o algoritmo FCM e algumas de suas variantes. A ideia é usar um subconjunto dos dados originais para definir o número de grupos e determinar o conjunto de centros iniciais através de um método baseado em funções do tipo média. Com essa nova metodologia, pretende-se reduzir os efeitos colaterais da fase de definição de grupos, possivelmente tornando mais rápido o tempo de processamento e diminuindo o custo computacional. Para avaliar a metodologia proposta, serão utilizados diferentes índices de validação de agrupamento, capazes de avaliar a qualidade dos agrupamentos obtidos pelo algoritmo FCM e algumas de suas variantes, quando aplicados a diferentes bases de dados.
publishDate 2021
dc.date.issued.fl_str_mv 2021-02-05
dc.date.accessioned.fl_str_mv 2022-03-21T16:17:36Z
dc.date.available.fl_str_mv 2022-03-21T16:17:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Huliane Medeiros da. Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais. 2021. 100f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/46634
identifier_str_mv SILVA, Huliane Medeiros da. Uma metodologia para definição do número de grupos e do conjunto de centros iniciais para algoritmos particionais. 2021. 100f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/46634
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/46634/1/Metodologiadefinicaonumero_Silva_2021.pdf
bitstream.checksum.fl_str_mv bb6a1a3f3334f3a7e73ac8d39dc676e5
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1797777267804340224