Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R

Detalhes bibliográficos
Autor(a) principal: Távora, Marcelus Santana
Data de Publicação: 2015
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Biblioteca Digital de Monografias da UnB
Texto Completo: http://bdm.unb.br/handle/10483/14108
Resumo: Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2015.
id UNB-2_afbdfb4ff8035c25504e8a9e7200281e
oai_identifier_str oai:bdm.unb.br:10483/14108
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Távora, Marcelus SantanaBiagio, Maria AméliaT ÁVORA, Marcelus Santana. Metodologia para Agrupamento de Dados- Uma versão da Busca Tabu para Sistema R. 2015. viii, 32 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2015.http://bdm.unb.br/handle/10483/14108Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2015.Metodologias não-hierárquicas para agrupamento de dados têm sido bastante estudadas e utilizadas nas últimas décadas, muitas delas buscando otimizar um critério comum que é o de minimizar a soma dos quadrados das discrepâncias internas aos grupos formados por seus procedimentos. O problema de se agrupar dados com este critério é bastante conhecido na literatura como problema MSSC (Minimum Sum of Squares Clustering). Dentre as metodologias voltadas para a resolução de problema MSSC deve-se citar a já bastante conhecida heurística K-Means. Com o mesmo propósito, muitas metodologias surgiram nas últimas décadas e, dentre as principais, destacam-se as metodologias H-Means, e mais recentemente sua forma não-degenerada H-Means+, as metodologias Tabu Search e VNS. No entanto, em ambiente computacional fortemente demandado por estatísticos, como o sistema computacional R, estas metodologias, com exceção da primeira, ainda não estão disponíveis. O presente trabalho consiste no desenvolvimento computacional, através da linguagem do sistema em referência (R Core Team, 2014), de uma versão híbrida da metodologia de agrupamento não-hierárquico Busca Tabu (ou Tabu Search) com a heurística H-Means+, esta última recentemente implementada em linguagem do sistema R. Resultados computacionais são obtidos para os bancos de dados USArrests e Íris de Fisher, ambos disponíveis no mesmo sistema em referência. Análise comparativa dos agrupamentos, obtidos pelas metodologias K-Means, H-Means+, a versão implementada e denominada HBaseTabu, e versão híbrida das duas primeiras, denominada HK-Means, é apresentada para distintos números de clusters. Os resultados apresentados são validados, no primeiro teste, através dos valores ótimos apresentados por K-Means, e por valores ótimos já conhecidos para os testes realizados com o banco de dados Iris. Através da análise dos resultados obtidos, pode-se observar que a heurística proposta e implementada neste trabalho apresenta resultados compatíveis com aqueles obtidos por K-Means e demonstra, em vários casos, superioridade sobre as heurísticas H-Means+ e HK-Means. Em situações em que o número de agrupamentos é maior que três. Em alguns casos os resultados obtidos mostraram-se melhores que os apresentados pela heurística K-Means, quando inicializou-se a metodologia implementada, HBaseTabu, com a melhor solução apresentada por K-Means, o que demonstra o poder de eficiência computacional da proposta HBaseTabu.Submitted by Aline Almeida (alinealmeida@bce.unb.br) on 2016-07-29T13:54:47Z No. of bitstreams: 1 2015_MarcelusSantanaTavora.pdf: 235718 bytes, checksum: 0d680ac029429efa1d7cf2957e3b12ab (MD5)Approved for entry into archive by Luanna Maia (luanna@bce.unb.br) on 2016-08-15T12:03:23Z (GMT) No. of bitstreams: 3 2015_MarcelusSantanaTavora.pdf: 235718 bytes, checksum: 0d680ac029429efa1d7cf2957e3b12ab (MD5) license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Made available in DSpace on 2016-08-15T12:03:23Z (GMT). No. of bitstreams: 3 2015_MarcelusSantanaTavora.pdf: 235718 bytes, checksum: 0d680ac029429efa1d7cf2957e3b12ab (MD5) license_text: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema Rinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2016-08-15T12:03:23Z2016-08-15T12:03:23Z2015Análise de agrupamento (Estatística)Programação heurísticaLinguagem de programação (Computadores)info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2015_MarcelusSantanaTavora.pdf2015_MarcelusSantanaTavora.pdfapplication/pdf235718http://bdm.unb.br/xmlui/bitstream/10483/14108/1/2015_MarcelusSantanaTavora.pdf0d680ac029429efa1d7cf2957e3b12abMD51CC-LICENSElicense_urllicense_urltext/plain49http://bdm.unb.br/xmlui/bitstream/10483/14108/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_textapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/14108/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/octet-stream0http://bdm.unb.br/xmlui/bitstream/10483/14108/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54LICENSElicense.txtlicense.txttext/plain1850http://bdm.unb.br/xmlui/bitstream/10483/14108/5/license.txtd63490116908ae205054020f17cd0a56MD5510483/141082016-08-15 09:03:23.56oai:bdm.unb.br:10483/14108TGljZW5zZSBncmFudGVkIGJ5IEFsaW5lICBBbG1laWRhIChhbGluZWFsbWVpZGFAYmNlLnVuYi5icikgb24gMjAxNi0wNy0yOVQxMzo1NDo0N1ogKEdNVCk6CgrDiSBuZWNlc3PDoXJpbyBjb25jb3JkYXIgY29tIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gbsOjby1leGNsdXNpdmEsCmFudGVzIHF1ZSBvIGRvY3VtZW50byBwb3NzYSBhcGFyZWNlciBubyBSZXBvc2l0w7NyaW8uIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712016-08-15T12:03:23Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
title Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
spellingShingle Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
Távora, Marcelus Santana
Análise de agrupamento (Estatística)
Programação heurística
Linguagem de programação (Computadores)
title_short Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
title_full Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
title_fullStr Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
title_full_unstemmed Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
title_sort Metodologia para agrupamento de dados : uma versão da Busca Tabu para sistema R
author Távora, Marcelus Santana
author_facet Távora, Marcelus Santana
author_role author
dc.contributor.author.fl_str_mv Távora, Marcelus Santana
dc.contributor.advisor1.fl_str_mv Biagio, Maria Amélia
contributor_str_mv Biagio, Maria Amélia
dc.subject.por.fl_str_mv Análise de agrupamento (Estatística)
Programação heurística
Linguagem de programação (Computadores)
topic Análise de agrupamento (Estatística)
Programação heurística
Linguagem de programação (Computadores)
description Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2015.
publishDate 2015
dc.date.submitted.none.fl_str_mv 2015
dc.date.accessioned.fl_str_mv 2016-08-15T12:03:23Z
dc.date.available.fl_str_mv 2016-08-15T12:03:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv T ÁVORA, Marcelus Santana. Metodologia para Agrupamento de Dados- Uma versão da Busca Tabu para Sistema R. 2015. viii, 32 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2015.
dc.identifier.uri.fl_str_mv http://bdm.unb.br/handle/10483/14108
identifier_str_mv T ÁVORA, Marcelus Santana. Metodologia para Agrupamento de Dados- Uma versão da Busca Tabu para Sistema R. 2015. viii, 32 f. Trabalho de Conclusão de Curso (Bacharelado em Estatística)—Universidade de Brasília, Brasília, 2015.
url http://bdm.unb.br/handle/10483/14108
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/14108/1/2015_MarcelusSantanaTavora.pdf
http://bdm.unb.br/xmlui/bitstream/10483/14108/2/license_url
http://bdm.unb.br/xmlui/bitstream/10483/14108/3/license_text
http://bdm.unb.br/xmlui/bitstream/10483/14108/4/license_rdf
http://bdm.unb.br/xmlui/bitstream/10483/14108/5/license.txt
bitstream.checksum.fl_str_mv 0d680ac029429efa1d7cf2957e3b12ab
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
d63490116908ae205054020f17cd0a56
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1813907887222685696