Revisão de métodos para análise de agrupamento de dados em data mining
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/22181 |
Resumo: | Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados. |
id |
UTFPR-12_17207d8e2fdf9354227c18543ee75118 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/22181 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-25T11:11:37Z2020-11-25T11:11:37Z2017-02-23TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017.http://repositorio.utfpr.edu.br/jspui/handle/1/22181Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados.The core components of data mining technology have been in development for decades. Today, the maturity of these techniques, coupled with high-performance database engines and extensive data integration efforts, make these technologies practical for today's environments. The cluster analysis aims to separate objects into groups, grouping them according to their characteristics in common with a predetermined criterion, identifying comprehensible patterns. To perform this classification the various data mining techniques use complex mathematical functions. In this context, even an easier abstraction of the formulas for grouping data is not simple to understand, especially for those who are not from the area or have no knowledge of mathematical concepts. The purpose of this work is to clarify the formulas of some methods of grouping data, explaining them in a practical and objective way, with examples, of how they work. For this, 3 algorithms of the same genre, k-means, k-medians and k-medoids were chosen to be detailed using the same set of data.porUniversidade Tecnológica Federal do ParanáPato BrancoBanco de Dados: Administração e DesenvolvimentoUTFPRBrasilCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOBanco de dadosMineração de dados (Computação)Armazenamento de dadosData basesData miningData WarehousingRevisão de métodos para análise de agrupamento de dados em data miningReview of methods for data clustering analysis in data mininginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisPato BrancoCasanova, DalcimarCasanova, DalcimarBarbosa, Marco Antonio de CastroSouza, Viviane Dal Molin deTrevisan, Luiz Fernandoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALPB_EBD_02_2017_14.pdfapplication/pdf865427http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/1/PB_EBD_02_2017_14.pdfeca7a63bf21c8f024614a1f8ab4297edMD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTPB_EBD_02_2017_14.pdf.txtExtracted texttext/plain37159http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/3/PB_EBD_02_2017_14.pdf.txtdfddef5ca41c72b9fd3e3e0cf5cf67abMD53THUMBNAILPB_EBD_02_2017_14.pdf.jpgGenerated Thumbnailimage/jpeg1277http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/4/PB_EBD_02_2017_14.pdf.jpgcb5bb03eb788562829474fbb57b5f2dcMD541/221812020-11-25 09:11:38.028oai:repositorio.utfpr.edu.br:1/22181TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-25T11:11:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Revisão de métodos para análise de agrupamento de dados em data mining |
dc.title.alternative.pt_BR.fl_str_mv |
Review of methods for data clustering analysis in data mining |
title |
Revisão de métodos para análise de agrupamento de dados em data mining |
spellingShingle |
Revisão de métodos para análise de agrupamento de dados em data mining Trevisan, Luiz Fernando CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Banco de dados Mineração de dados (Computação) Armazenamento de dados Data bases Data mining Data Warehousing |
title_short |
Revisão de métodos para análise de agrupamento de dados em data mining |
title_full |
Revisão de métodos para análise de agrupamento de dados em data mining |
title_fullStr |
Revisão de métodos para análise de agrupamento de dados em data mining |
title_full_unstemmed |
Revisão de métodos para análise de agrupamento de dados em data mining |
title_sort |
Revisão de métodos para análise de agrupamento de dados em data mining |
author |
Trevisan, Luiz Fernando |
author_facet |
Trevisan, Luiz Fernando |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Casanova, Dalcimar |
dc.contributor.referee1.fl_str_mv |
Casanova, Dalcimar |
dc.contributor.referee2.fl_str_mv |
Barbosa, Marco Antonio de Castro |
dc.contributor.referee3.fl_str_mv |
Souza, Viviane Dal Molin de |
dc.contributor.author.fl_str_mv |
Trevisan, Luiz Fernando |
contributor_str_mv |
Casanova, Dalcimar Casanova, Dalcimar Barbosa, Marco Antonio de Castro Souza, Viviane Dal Molin de |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Banco de dados Mineração de dados (Computação) Armazenamento de dados Data bases Data mining Data Warehousing |
dc.subject.por.fl_str_mv |
Banco de dados Mineração de dados (Computação) Armazenamento de dados Data bases Data mining Data Warehousing |
description |
Os componentes centrais da tecnologia de mineração de dados estão em desenvolvimento há décadas. Hoje, a maturidade dessas técnicas, aliada aos motores de banco de dados de alto desempenho e aos amplos esforços de integração de dados, tornam essas tecnologias práticas para os ambientes atuais. A análise de agrupamento tem como objetivo separar objetos em grupos, agrupando-os de acordo com as suas características em comum com um critério pré-determinado, identificado padrões compreensíveis. Para realizar esta classificação as diversas técnicas de mineração de dados utilizam funções matemáticas complexas. Nesse contexto, até mesmo uma abstração mais fácil das formulas para agrupamento de dados não é simples de ser entendida, principalmente para quem não é da área ou não tem conhecimento de conceitos matemáticos. O objetivo deste trabalho é esclarecer as fórmulas de alguns métodos de agrupamento de dados, explicando-os de forma pratica e objetiva, com exemplos, de como eles funcionam. Para isso foram escolhidos 3 algoritmos do mesmo gênero, k-means, k-medians e k-medoids, para serem detalhados utilizando o mesmo conjunto de dados. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017-02-23 |
dc.date.accessioned.fl_str_mv |
2020-11-25T11:11:37Z |
dc.date.available.fl_str_mv |
2020-11-25T11:11:37Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/22181 |
identifier_str_mv |
TREVISAN, Luiz Fernando. Revisão de métodos para análise de agrupamento de dados em data mining. 2017. 25 f. Trabalho de Conclusão de Curso (Especialização) - Universidade Tecnológica Federal do Paraná, Pato Branco, 2017. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/22181 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Pato Branco |
dc.publisher.program.fl_str_mv |
Banco de Dados: Administração e Desenvolvimento |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Pato Branco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/1/PB_EBD_02_2017_14.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/3/PB_EBD_02_2017_14.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/22181/4/PB_EBD_02_2017_14.pdf.jpg |
bitstream.checksum.fl_str_mv |
eca7a63bf21c8f024614a1f8ab4297ed b9d82215ab23456fa2d8b49c5df1b95b dfddef5ca41c72b9fd3e3e0cf5cf67ab cb5bb03eb788562829474fbb57b5f2dc |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923022800945152 |