Revisão de métodos para análise de agrupamento de dados em data mining

Detalhes bibliográficos
Autor(a) principal: Trevisan, Luiz Fernando
Data de Publicação: 2017
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/22181
Resumo: Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados.
id UTFPR-12_17207d8e2fdf9354227c18543ee75118
oai_identifier_str oai:repositorio.utfpr.edu.br:1/22181
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-25T11:11:37Z2020-11-25T11:11:37Z2017-02-23TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017.http://repositorio.utfpr.edu.br/jspui/handle/1/22181Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados.The core components of data mining technology have been in development for decades. Today, the maturity of these techniques, coupled with high-performance database engines and extensive data integration efforts, make these technologies practical for today's environments. The cluster analysis aims to separate objects into groups, grouping them according to their characteristics in common with a predetermined criterion, identifying comprehensible patterns. To perform this classification the various data mining techniques use complex mathematical functions. In this context, even an easier abstraction of the formulas for grouping data is not simple to understand, especially for those who are not from the area or have no knowledge of mathematical concepts. The purpose of this work is to clarify the formulas of some methods of grouping data, explaining them in a practical and objective way, with examples, of how they work. For this, 3 algorithms of the same genre, k-means, k-medians and k-medoids were chosen to be detailed using the same set of data.porUniversidade Tecnológica Federal do ParanáPato BrancoBanco de Dados: Administração e DesenvolvimentoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOBanco de dadosMineração de dados (Computação)Armazenamento de dadosData basesData miningData WarehousingRevisão de métodos para análise de agrupamento de dados em data miningReview of methods for data clustering analysis in data mininginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPato BrancoCasanova, DalcimarCasanova, DalcimarBarbosa, Marco Antonio de CastroSouza, Viviane Dal Molin deTrevisan, Luiz Fernandoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPB_EBD_02_2017_14.pdfapplication/pdf865427http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/1/PB_EBD_02_2017_14.pdfeca7a63bf21c8f024614a1f8ab4297edMD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPB_EBD_02_2017_14.pdf.txtExtracted texttext/plain37159http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/3/PB_EBD_02_2017_14.pdf.txtdfddef5ca41c72b9fd3e3e0cf5cf67abMD53THUMBNAILPB_EBD_02_2017_14.pdf.jpgGenerated Thumbnailimage/jpeg1277http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/4/PB_EBD_02_2017_14.pdf.jpgcb5bb03eb788562829474fbb57b5f2dcMD541/221812020-11-25 09:11:38.028oai:repositorio.utfpr.edu.br:1/22181TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-25T11:11:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Revisão de métodos para análise de agrupamento de dados em data mining
dc.title.alternative.pt_BR.fl_str_mv Review of methods for data clustering analysis in data mining
title Revisão de métodos para análise de agrupamento de dados em data mining
spellingShingle Revisão de métodos para análise de agrupamento de dados em data mining
Trevisan, Luiz Fernando
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Banco de dados
Mineração de dados (Computação)
Armazenamento de dados
Data bases
Data mining
Data Warehousing
title_short Revisão de métodos para análise de agrupamento de dados em data mining
title_full Revisão de métodos para análise de agrupamento de dados em data mining
title_fullStr Revisão de métodos para análise de agrupamento de dados em data mining
title_full_unstemmed Revisão de métodos para análise de agrupamento de dados em data mining
title_sort Revisão de métodos para análise de agrupamento de dados em data mining
author Trevisan, Luiz Fernando
author_facet Trevisan, Luiz Fernando
author_role author
dc.contributor.advisor1.fl_str_mv Casanova, Dalcimar
dc.contributor.referee1.fl_str_mv Casanova, Dalcimar
dc.contributor.referee2.fl_str_mv Barbosa, Marco Antonio de Castro
dc.contributor.referee3.fl_str_mv Souza, Viviane Dal Molin de
dc.contributor.author.fl_str_mv Trevisan, Luiz Fernando
contributor_str_mv Casanova, Dalcimar
Casanova, Dalcimar
Barbosa, Marco Antonio de Castro
Souza, Viviane Dal Molin de
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Banco de dados
Mineração de dados (Computação)
Armazenamento de dados
Data bases
Data mining
Data Warehousing
dc.subject.por.fl_str_mv Banco de dados
Mineração de dados (Computação)
Armazenamento de dados
Data bases
Data mining
Data Warehousing
description Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados.
publishDate 2017
dc.date.issued.fl_str_mv 2017-02-23
dc.date.accessioned.fl_str_mv 2020-11-25T11:11:37Z
dc.date.available.fl_str_mv 2020-11-25T11:11:37Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/22181
identifier_str_mv TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017.
url http://repositorio.utfpr.edu.br/jspui/handle/1/22181
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Pato Branco
dc.publisher.program.fl_str_mv Banco de Dados: Administração e Desenvolvimento
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Pato Branco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/1/PB_EBD_02_2017_14.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/3/PB_EBD_02_2017_14.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/4/PB_EBD_02_2017_14.pdf.jpg
bitstream.checksum.fl_str_mv eca7a63bf21c8f024614a1f8ab4297ed
b9d82215ab23456fa2d8b49c5df1b95b
dfddef5ca41c72b9fd3e3e0cf5cf67ab
cb5bb03eb788562829474fbb57b5f2dc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1797043947127701504