QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos

Detalhes bibliográficos
Autor(a) principal: Pilar, João Victor do
Data de Publicação: 2018
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/14612
Resumo: A tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste trabalho, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem.
id UTFPR-12_a8dc6947afc389c8f19d1932d0370340
oai_identifier_str oai:repositorio.utfpr.edu.br:1/14612
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-18T14:01:50Z2020-11-18T14:01:50Z2018-12-06PILAR, João Victor do. QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos. 2018. 38 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/14612A tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste trabalho, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem.The class identification task for spatial databases can be achieved by clustering algorithms. However, it requires a domain knowledge to determine some input parameters to discover clusters and the improvement of its efficiency on large databases remains a challenge. Modern applications also deal with complex data and the comparison mechanisms are based on similarity predicates, which demands a new front of clustering algorithms. Complex data are usually immersed in metric spaces where distance functions are employed to express the similarity. Clustering becomes a difficult task due to the need of performing distance calculations. Density-based are one of the most interesting approaches to find clusters in metric spaces and have the advantage of finding clusters without the need of specifying the number of clusters to find. Although some suggested using indexes to speed up neighbor queries, they still process the entire space of elements calculating distances before finding clusters. In this paper we propose a new technique to separate clusters by using pivots selected at the border of the data space. Multiple pivots partition the data space into candidate clusters based on the desired density level, later all candidates are fused generating a good separation of clusters. Our technique can also be used prior to any existing clustering technique for a performance speed up. Therefore, we performed experiments by using one density clustering algorithm from literature and the results showed that our technique reduced the cost of the clustering process.porUniversidade Tecnológica Federal do ParanáPato BrancoEngenharia de ComputaçãoUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOSInstrumentos de medição - DensidadeEspaços métricosMineração de dados (Computação)Measuring instruments - DensityMetric spacesData miningQuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricosQuickDBC: Quick density-based clustering separation for metric spacesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPato BrancoPola, Ives Renê VenturiniPola, Fernanda Paula BarbosaPola, Ives Renê VenturiniPola, Fernanda Paula BarbosaCasanova, DalcimarCavalcanti, Pablo GautérioPilar, João Victor doinfo:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPB_COENC_2018_2_08.pdfapplication/pdf57046693http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/1/PB_COENC_2018_2_08.pdf25394c33ea9123677e46e234b5e75565MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPB_COENC_2018_2_08.pdf.txtExtracted texttext/plain57367http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/3/PB_COENC_2018_2_08.pdf.txt5571b535ad122707b1ba843cc738c483MD53THUMBNAILPB_COENC_2018_2_08.pdf.jpgGenerated Thumbnailimage/jpeg1389http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/4/PB_COENC_2018_2_08.pdf.jpgfbef9580147a80416350904ad51e2172MD541/146122020-11-18 12:01:50.185oai:repositorio.utfpr.edu.br:1/14612TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-18T14:01:50Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
dc.title.alternative.pt_BR.fl_str_mv QuickDBC: Quick density-based clustering separation for metric spaces
title QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
spellingShingle QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
Pilar, João Victor do
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
Instrumentos de medição - Densidade
Espaços métricos
Mineração de dados (Computação)
Measuring instruments - Density
Metric spaces
Data mining
title_short QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
title_full QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
title_fullStr QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
title_full_unstemmed QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
title_sort QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
author Pilar, João Victor do
author_facet Pilar, João Victor do
author_role author
dc.contributor.advisor1.fl_str_mv Pola, Ives Renê Venturini
dc.contributor.advisor-co1.fl_str_mv Pola, Fernanda Paula Barbosa
dc.contributor.referee1.fl_str_mv Pola, Ives Renê Venturini
dc.contributor.referee2.fl_str_mv Pola, Fernanda Paula Barbosa
dc.contributor.referee3.fl_str_mv Casanova, Dalcimar
dc.contributor.referee4.fl_str_mv Cavalcanti, Pablo Gautério
dc.contributor.author.fl_str_mv Pilar, João Victor do
contributor_str_mv Pola, Ives Renê Venturini
Pola, Fernanda Paula Barbosa
Pola, Ives Renê Venturini
Pola, Fernanda Paula Barbosa
Casanova, Dalcimar
Cavalcanti, Pablo Gautério
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS
Instrumentos de medição - Densidade
Espaços métricos
Mineração de dados (Computação)
Measuring instruments - Density
Metric spaces
Data mining
dc.subject.por.fl_str_mv Instrumentos de medição - Densidade
Espaços métricos
Mineração de dados (Computação)
Measuring instruments - Density
Metric spaces
Data mining
description A tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste trabalho, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem.
publishDate 2018
dc.date.issued.fl_str_mv 2018-12-06
dc.date.accessioned.fl_str_mv 2020-11-18T14:01:50Z
dc.date.available.fl_str_mv 2020-11-18T14:01:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PILAR, João Victor do. QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos. 2018. 38 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/14612
identifier_str_mv PILAR, João Victor do. QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos. 2018. 38 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018.
url http://repositorio.utfpr.edu.br/jspui/handle/1/14612
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Pato Branco
dc.publisher.program.fl_str_mv Engenharia de Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Informática
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Pato Branco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/1/PB_COENC_2018_2_08.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/3/PB_COENC_2018_2_08.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/4/PB_COENC_2018_2_08.pdf.jpg
bitstream.checksum.fl_str_mv 25394c33ea9123677e46e234b5e75565
b9d82215ab23456fa2d8b49c5df1b95b
5571b535ad122707b1ba843cc738c483
fbef9580147a80416350904ad51e2172
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923075509714944