QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/14612 |
Resumo: | A tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste trabalho, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem. |
id |
UTFPR-12_a8dc6947afc389c8f19d1932d0370340 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/14612 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-18T14:01:50Z2020-11-18T14:01:50Z2018-12-06PILAR, João Victor do. QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos. 2018. 38 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018.http://repositorio.utfpr.edu.br/jspui/handle/1/14612A tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste trabalho, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem.The class identification task for spatial databases can be achieved by clustering algorithms. However, it requires a domain knowledge to determine some input parameters to discover clusters and the improvement of its efficiency on large databases remains a challenge. Modern applications also deal with complex data and the comparison mechanisms are based on similarity predicates, which demands a new front of clustering algorithms. Complex data are usually immersed in metric spaces where distance functions are employed to express the similarity. Clustering becomes a difficult task due to the need of performing distance calculations. Density-based are one of the most interesting approaches to find clusters in metric spaces and have the advantage of finding clusters without the need of specifying the number of clusters to find. Although some suggested using indexes to speed up neighbor queries, they still process the entire space of elements calculating distances before finding clusters. In this paper we propose a new technique to separate clusters by using pivots selected at the border of the data space. Multiple pivots partition the data space into candidate clusters based on the desired density level, later all candidates are fused generating a good separation of clusters. Our technique can also be used prior to any existing clustering technique for a performance speed up. Therefore, we performed experiments by using one density clustering algorithm from literature and the results showed that our technique reduced the cost of the clustering process.porUniversidade Tecnológica Federal do ParanáPato BrancoEngenharia de ComputaçãoUTFPRBrasilDepartamento Acadêmico de InformáticaCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOSInstrumentos de medição - DensidadeEspaços métricosMineração de dados (Computação)Measuring instruments - DensityMetric spacesData miningQuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricosQuickDBC: Quick density-based clustering separation for metric spacesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPato BrancoPola, Ives Renê VenturiniPola, Fernanda Paula BarbosaPola, Ives Renê VenturiniPola, Fernanda Paula BarbosaCasanova, DalcimarCavalcanti, Pablo GautérioPilar, João Victor doinfo:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPB_COENC_2018_2_08.pdfapplication/pdf57046693http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/1/PB_COENC_2018_2_08.pdf25394c33ea9123677e46e234b5e75565MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPB_COENC_2018_2_08.pdf.txtExtracted texttext/plain57367http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/3/PB_COENC_2018_2_08.pdf.txt5571b535ad122707b1ba843cc738c483MD53THUMBNAILPB_COENC_2018_2_08.pdf.jpgGenerated Thumbnailimage/jpeg1389http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/4/PB_COENC_2018_2_08.pdf.jpgfbef9580147a80416350904ad51e2172MD541/146122020-11-18 12:01:50.185oai:repositorio.utfpr.edu.br:1/14612TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-18T14:01:50Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos |
dc.title.alternative.pt_BR.fl_str_mv |
QuickDBC: Quick density-based clustering separation for metric spaces |
title |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos |
spellingShingle |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos Pilar, João Victor do CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS Instrumentos de medição - Densidade Espaços métricos Mineração de dados (Computação) Measuring instruments - Density Metric spaces Data mining |
title_short |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos |
title_full |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos |
title_fullStr |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos |
title_full_unstemmed |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos |
title_sort |
QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos |
author |
Pilar, João Victor do |
author_facet |
Pilar, João Victor do |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Pola, Ives Renê Venturini |
dc.contributor.advisor-co1.fl_str_mv |
Pola, Fernanda Paula Barbosa |
dc.contributor.referee1.fl_str_mv |
Pola, Ives Renê Venturini |
dc.contributor.referee2.fl_str_mv |
Pola, Fernanda Paula Barbosa |
dc.contributor.referee3.fl_str_mv |
Casanova, Dalcimar |
dc.contributor.referee4.fl_str_mv |
Cavalcanti, Pablo Gautério |
dc.contributor.author.fl_str_mv |
Pilar, João Victor do |
contributor_str_mv |
Pola, Ives Renê Venturini Pola, Fernanda Paula Barbosa Pola, Ives Renê Venturini Pola, Fernanda Paula Barbosa Casanova, Dalcimar Cavalcanti, Pablo Gautério |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS Instrumentos de medição - Densidade Espaços métricos Mineração de dados (Computação) Measuring instruments - Density Metric spaces Data mining |
dc.subject.por.fl_str_mv |
Instrumentos de medição - Densidade Espaços métricos Mineração de dados (Computação) Measuring instruments - Density Metric spaces Data mining |
description |
A tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste trabalho, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-12-06 |
dc.date.accessioned.fl_str_mv |
2020-11-18T14:01:50Z |
dc.date.available.fl_str_mv |
2020-11-18T14:01:50Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PILAR, João Victor do. QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos. 2018. 38 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/14612 |
identifier_str_mv |
PILAR, João Victor do. QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos. 2018. 38 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2018. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/14612 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/embargoedAccess |
eu_rights_str_mv |
embargoedAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Pato Branco |
dc.publisher.program.fl_str_mv |
Engenharia de Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento Acadêmico de Informática |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Pato Branco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/1/PB_COENC_2018_2_08.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/3/PB_COENC_2018_2_08.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/14612/4/PB_COENC_2018_2_08.pdf.jpg |
bitstream.checksum.fl_str_mv |
25394c33ea9123677e46e234b5e75565 b9d82215ab23456fa2d8b49c5df1b95b 5571b535ad122707b1ba843cc738c483 fbef9580147a80416350904ad51e2172 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923075509714944 |