Uma proposta para a determinação do número de clusters

Detalhes bibliográficos
Autor(a) principal: Quadros, Allan Vieira de Castro
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: https://bdm.unb.br/handle/10483/25134
Resumo: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.
id UNB-2_a8207e1793a008650270ef613bbfc59c
oai_identifier_str oai:bdm.unb.br:10483/25134
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Quadros, Allan Vieira de CastroCançado, André Luiz FernandesQUADROS, Allan Vieira de Castro. Uma proposta para a determinação do número de clusters. 2018. x, 52 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018.https://bdm.unb.br/handle/10483/25134Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.Determinar o número k de grupos nos dados é um problema recorrente na análise de clusters. Neste trabalho, propomos um método para a estimação de k utilizando uma função multiobjetivo. Um algoritmo de agrupamento baseado em árvores geradoras mínimas (MST) é executado nos dados reais e em hipercubos simulados a partir de distribui- ções Uniformes utilizando uma adptação do conceito de cubic clustering criterion (CCC). As estatísticas de teste obtidas para k = 2; 3; :::n clusters são então comparadas e determina-se o valor mais adequado de k. Espera-se que soluções espúrias de agrupamento nos dados apresentem valores de estatísticas de teste próximos aos das simulações. Os testes iniciais do algoritmo indicam um bom funcionamento para dados com clusters elipsóides e alongados. A presença de outliers e de grupos anelares, por outro lado, di cultam seu funcionamento.Submitted by Jaedna Lins (jaednalins@bce.unb.br) on 2020-06-04T03:38:07Z No. of bitstreams: 1 2018_AllanVieiraDeCastroQuadros_tcc.pdf: 1879735 bytes, checksum: 62bc8322f98955673a72aaa378d226e7 (MD5)Approved for entry into archive by Biblioteca Digital de Monografias Gerência (bdm@bce.unb.br) on 2020-07-29T23:12:19Z (GMT) No. of bitstreams: 1 2018_AllanVieiraDeCastroQuadros_tcc.pdf: 1879735 bytes, checksum: 62bc8322f98955673a72aaa378d226e7 (MD5)Made available in DSpace on 2020-07-29T23:12:19Z (GMT). No. of bitstreams: 1 2018_AllanVieiraDeCastroQuadros_tcc.pdf: 1879735 bytes, checksum: 62bc8322f98955673a72aaa378d226e7 (MD5)Finding the number k of groups in data is a common problem in cluster analysis. In this study we propose a method to estimate k using a multiobjective function. We run a Minimum Spanning Tree (MST) based clustering algorithm on real data and on hypercubes which are simulated from Uniform distributions using an adaptation of the cubic clustering criterion (CCC) concept. The test statistics obtained for k = 2; 3; :::n clusters are then compared and the most appropriate value of k is determined. Spurious solutions in grouping real data are expected to present test statistics values close to those of simulations. Initial tests indicate a great performance on data with ellipsoid and elongated clusters. On the other hand, the algorithm fails in the presence of outliers and ring shaped groups.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessClusterÁrvores geradoras mínimas (MST)Otimização de ParetoUma proposta para a determinação do número de clustersinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2020-07-29T23:12:19Z2020-07-29T23:12:19Z2018-07-06porreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBLICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/25134/2/license.txt21554873e56ad8ddc69c092699b98f95MD52ORIGINAL2018_AllanVieiraDeCastroQuadros_tcc.pdf2018_AllanVieiraDeCastroQuadros_tcc.pdfapplication/pdf1879735http://bdm.unb.br/xmlui/bitstream/10483/25134/1/2018_AllanVieiraDeCastroQuadros_tcc.pdf62bc8322f98955673a72aaa378d226e7MD5110483/251342021-07-01 11:00:14.232oai:bdm.unb.br:10483/25134w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712021-07-01T14:00:14Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Uma proposta para a determinação do número de clusters
title Uma proposta para a determinação do número de clusters
spellingShingle Uma proposta para a determinação do número de clusters
Quadros, Allan Vieira de Castro
Cluster
Árvores geradoras mínimas (MST)
Otimização de Pareto
title_short Uma proposta para a determinação do número de clusters
title_full Uma proposta para a determinação do número de clusters
title_fullStr Uma proposta para a determinação do número de clusters
title_full_unstemmed Uma proposta para a determinação do número de clusters
title_sort Uma proposta para a determinação do número de clusters
author Quadros, Allan Vieira de Castro
author_facet Quadros, Allan Vieira de Castro
author_role author
dc.contributor.author.fl_str_mv Quadros, Allan Vieira de Castro
dc.contributor.advisor1.fl_str_mv Cançado, André Luiz Fernandes
contributor_str_mv Cançado, André Luiz Fernandes
dc.subject.keyword.pt_BR.fl_str_mv Cluster
Árvores geradoras mínimas (MST)
Otimização de Pareto
topic Cluster
Árvores geradoras mínimas (MST)
Otimização de Pareto
description Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2018.
publishDate 2018
dc.date.submitted.none.fl_str_mv 2018-07-06
dc.date.accessioned.fl_str_mv 2020-07-29T23:12:19Z
dc.date.available.fl_str_mv 2020-07-29T23:12:19Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv QUADROS, Allan Vieira de Castro. Uma proposta para a determinação do número de clusters. 2018. x, 52 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018.
dc.identifier.uri.fl_str_mv https://bdm.unb.br/handle/10483/25134
identifier_str_mv QUADROS, Allan Vieira de Castro. Uma proposta para a determinação do número de clusters. 2018. x, 52 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2018.
url https://bdm.unb.br/handle/10483/25134
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/25134/2/license.txt
http://bdm.unb.br/xmlui/bitstream/10483/25134/1/2018_AllanVieiraDeCastroQuadros_tcc.pdf
bitstream.checksum.fl_str_mv 21554873e56ad8ddc69c092699b98f95
62bc8322f98955673a72aaa378d226e7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1801493116677521408