Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados

Detalhes bibliográficos
Autor(a) principal: Silva, Walter José da
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/12596
https://doi.org/10.14393/ufu.di.2015.286
Resumo: The incorporation of semi-supervision in the cluster detection process has proved especially useful when one wants to get a high consistency between the data partitioning and the knowledge the user has about the data domain. In recent years, several strategies for semi-supervised clustering have been proposed. The approaches adopted by these strategies aim at guiding the process of cluster detection by using constraints with the following purposes: to interfere with the allocation of instances to the most appropriate cluster at each iteration of the algorithm; or to modify the objective function employed. This dissertation presents a novel approach for incorporating semi-supervision in the wellknown k-means algorithm. This semi-supervised clustering method employs constraint information in the definition of multiple assistant representatives for the centroids used at each iteration of k-means and generating new types of constraints acting on prototype level. A refinement process is designed to reduce the number of assistant representatives considered for each centroid without losing the clustering quality. The experimental results show the potential of the proposed approach for dealing with clustering composed by clusters of different shapes, sizes and densities.
id UFU_6daa27d429a3f96b851c7f90d1d4fe28
oai_identifier_str oai:repositorio.ufu.br:123456789/12596
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionadosAgrupamento de dadosAgrupamento semi-supervisionadoAgrupamento por particionamentoRestrição em nível de protótipoData clusteringSemi-supervised clusteringPartitional clusteringPrototypelevel constraintsCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe incorporation of semi-supervision in the cluster detection process has proved especially useful when one wants to get a high consistency between the data partitioning and the knowledge the user has about the data domain. In recent years, several strategies for semi-supervised clustering have been proposed. The approaches adopted by these strategies aim at guiding the process of cluster detection by using constraints with the following purposes: to interfere with the allocation of instances to the most appropriate cluster at each iteration of the algorithm; or to modify the objective function employed. This dissertation presents a novel approach for incorporating semi-supervision in the wellknown k-means algorithm. This semi-supervised clustering method employs constraint information in the definition of multiple assistant representatives for the centroids used at each iteration of k-means and generating new types of constraints acting on prototype level. A refinement process is designed to reduce the number of assistant representatives considered for each centroid without losing the clustering quality. The experimental results show the potential of the proposed approach for dealing with clustering composed by clusters of different shapes, sizes and densities.Fundação de Amparo a Pesquisa do Estado de Minas GeraisMestre em Ciência da ComputaçãoA incorporação de semi-supervisão no processo de detecção de agrupamento de dados tem sido especialmente útil quando se deseja obter uma alta consistência entre o particionamento dos dados e o conhecimento do usuário sobre a verdadeira estrutura dos dados. Nos últimos tempos, várias estratégias para detecção de agrupamentos semisupervisionado de dados têm sido propostas. As abordagens adotadas por essas estratégias têm como objetivo guiar o processo de detecção de agrupamentos por meio do uso de restrições com os seguintes propósitos: interferindo na atribuição das instâncias ao grupo mais apropriado a cada iteração do algoritmo; ou modificando a função objetivo utilizada. Esta dissertação apresenta uma nova abordagem para incorporar semi-supervisão ao amplamente conhecido algoritmo k-means. Esse método de agrupamento semi-supervisionado emprega as informações de restrições na definição de múltiplos representantes auxiliares para os centróides utilizados a cada iteração do k-means e na geração de novos tipos de restrições que agem em nível de protótipo. Um processo de refinamento é desenvolvido para reduzir o número de representantes auxiliares considerados a cada centróide, sem perder a qualidade do agrupamento. Os resultados experimentais mostram o potencial da abordagem proposta para lidar com agrupamentos de diferentes formas, tamanhos e densidades.Universidade Federal de UberlândiaBRPrograma de Pós-graduação em Ciência da ComputaçãoCiências Exatas e da TerraUFUAmo, Sandra Aparecida dehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4791545U6Barioni, Maria Camila Nardinihttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4770458D2Guliato, Denisehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525E4Sousa, Elaine Parros Machado dehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4768076T7Silva, Walter José da2016-06-22T18:32:35Z2016-04-262016-06-22T18:32:35Z2015-06-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfSILVA, Walter José da. Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados. 2015. 128 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de Uberlândia, Uberlândia, 2015. DOI https://doi.org/10.14393/ufu.di.2015.286https://repositorio.ufu.br/handle/123456789/12596https://doi.org/10.14393/ufu.di.2015.286porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2021-06-23T17:31:45Zoai:repositorio.ufu.br:123456789/12596Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2021-06-23T17:31:45Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
title Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
spellingShingle Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
Silva, Walter José da
Agrupamento de dados
Agrupamento semi-supervisionado
Agrupamento por particionamento
Restrição em nível de protótipo
Data clustering
Semi-supervised clustering
Partitional clustering
Prototypelevel constraints
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
title_full Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
title_fullStr Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
title_full_unstemmed Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
title_sort Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados
author Silva, Walter José da
author_facet Silva, Walter José da
author_role author
dc.contributor.none.fl_str_mv Amo, Sandra Aparecida de
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4791545U6
Barioni, Maria Camila Nardini
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4770458D2
Guliato, Denise
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790525E4
Sousa, Elaine Parros Machado de
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4768076T7
dc.contributor.author.fl_str_mv Silva, Walter José da
dc.subject.por.fl_str_mv Agrupamento de dados
Agrupamento semi-supervisionado
Agrupamento por particionamento
Restrição em nível de protótipo
Data clustering
Semi-supervised clustering
Partitional clustering
Prototypelevel constraints
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Agrupamento de dados
Agrupamento semi-supervisionado
Agrupamento por particionamento
Restrição em nível de protótipo
Data clustering
Semi-supervised clustering
Partitional clustering
Prototypelevel constraints
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The incorporation of semi-supervision in the cluster detection process has proved especially useful when one wants to get a high consistency between the data partitioning and the knowledge the user has about the data domain. In recent years, several strategies for semi-supervised clustering have been proposed. The approaches adopted by these strategies aim at guiding the process of cluster detection by using constraints with the following purposes: to interfere with the allocation of instances to the most appropriate cluster at each iteration of the algorithm; or to modify the objective function employed. This dissertation presents a novel approach for incorporating semi-supervision in the wellknown k-means algorithm. This semi-supervised clustering method employs constraint information in the definition of multiple assistant representatives for the centroids used at each iteration of k-means and generating new types of constraints acting on prototype level. A refinement process is designed to reduce the number of assistant representatives considered for each centroid without losing the clustering quality. The experimental results show the potential of the proposed approach for dealing with clustering composed by clusters of different shapes, sizes and densities.
publishDate 2015
dc.date.none.fl_str_mv 2015-06-02
2016-06-22T18:32:35Z
2016-04-26
2016-06-22T18:32:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Walter José da. Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados. 2015. 128 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de Uberlândia, Uberlândia, 2015. DOI https://doi.org/10.14393/ufu.di.2015.286
https://repositorio.ufu.br/handle/123456789/12596
https://doi.org/10.14393/ufu.di.2015.286
identifier_str_mv SILVA, Walter José da. Incorporação de múltiplos representantes auxiliares em processos de detecção de agrupamentos semi-supervisionados. 2015. 128 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de Uberlândia, Uberlândia, 2015. DOI https://doi.org/10.14393/ufu.di.2015.286
url https://repositorio.ufu.br/handle/123456789/12596
https://doi.org/10.14393/ufu.di.2015.286
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
BR
Programa de Pós-graduação em Ciência da Computação
Ciências Exatas e da Terra
UFU
publisher.none.fl_str_mv Universidade Federal de Uberlândia
BR
Programa de Pós-graduação em Ciência da Computação
Ciências Exatas e da Terra
UFU
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1813711520833470464