Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais

Detalhes bibliográficos
Autor(a) principal: Carvalho, Priscilla Ramos
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/85/85131/tde-31102018-112210/
Resumo: Objetivou-se, com este trabalho, estudar os métodos hierárquicos de análise de agrupamentos (ligação simples, ligação completa, ligação média, centróide e de Ward com base nas distâncias Euclidiana, Euclidiana ao quadrado, Manhattan e Mahalanobis), de modo a identificar qual é o mais adequado para uma base de dados arqueológicos. Utilizou-se uma base de dados fornecida pelo Grupo de Estudos Arqueométricos do IPEN CNEN/SP, na qual foram analisadas 146 amostras de fragmentos cerâmicos de três sítios arqueológicos por análise por ativação com nêutrons instrumental, sendo determinadas as frações de massa de 24 elementos químicos: As, Ba, Ce, Co, Cr, Cs, Eu, Fe, Hf, K, La, Lu, Na, Nd, Rb, Sb, Sc, Sm, Ta, Tb, Th, U, Yb e Zn. Para a determinação do melhor método, foram avaliados os dendrogramas conjuntamente com o valor dos coeficientes de correlação cofenética (CCC), obtidos para cada método. O método da ligação média mostrou-se mais coerente na formação dos agrupamentos, apresentando também os maiores valores do CCC. Por último, um script com funções do programa estatístico R foi desenvolvido para calcular o CCC, com o intuito de auxiliar os pesquisadores a encontrar o método de agrupamento mais apropriado para sua base de dados.
id USP_b893c6f0849716eca9e84f001e924ddd
oai_identifier_str oai:teses.usp.br:tde-31102018-112210
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentaisComparative study of hierarchical algorithms of cluster analysis in experimental resultsanálise de agrupamentosArchaeometryArqueometriacluster analysisCoeficiente de Correlação CofenéticaCophenetic Correlation Coefficienthierarchical methodsINAAINAAmétodos hierárquicosObjetivou-se, com este trabalho, estudar os métodos hierárquicos de análise de agrupamentos (ligação simples, ligação completa, ligação média, centróide e de Ward com base nas distâncias Euclidiana, Euclidiana ao quadrado, Manhattan e Mahalanobis), de modo a identificar qual é o mais adequado para uma base de dados arqueológicos. Utilizou-se uma base de dados fornecida pelo Grupo de Estudos Arqueométricos do IPEN CNEN/SP, na qual foram analisadas 146 amostras de fragmentos cerâmicos de três sítios arqueológicos por análise por ativação com nêutrons instrumental, sendo determinadas as frações de massa de 24 elementos químicos: As, Ba, Ce, Co, Cr, Cs, Eu, Fe, Hf, K, La, Lu, Na, Nd, Rb, Sb, Sc, Sm, Ta, Tb, Th, U, Yb e Zn. Para a determinação do melhor método, foram avaliados os dendrogramas conjuntamente com o valor dos coeficientes de correlação cofenética (CCC), obtidos para cada método. O método da ligação média mostrou-se mais coerente na formação dos agrupamentos, apresentando também os maiores valores do CCC. Por último, um script com funções do programa estatístico R foi desenvolvido para calcular o CCC, com o intuito de auxiliar os pesquisadores a encontrar o método de agrupamento mais apropriado para sua base de dados.The objective of this work was to study the hierarchical methods of cluster analysis (single linkage, complete linkage, average linkage, centroid and Ward with base in the Euclidean distance, Squared Euclidean distance, Manhattan and Mahalanobis) to identify which is the most appropriate in archaeological data set. It was used a data set provided by the Archaeometry Studies Group from IPEN CNEN/SP in which 146 samples of ceramic fragments from three archaeological sites analyzed by instrumental neutron activation analysis, being determined the mass fractions of 24 chemical elements: As, Ba, Ce, Co, Cr, Cs, Eu, Fe, Hf, K, La, Lu, Na, Nd, Rb, Sb, Sc, Sm, Ta, Tb, Th, U, Yb and Zn. For the determination of the best method, it was evaluated the dendrograms together with value of the cophenetic correlation coefficient (CCC) obtained for each method. The average linkage method was more coherent in formation of the clusters, and with higher CCC values. Finally, a script with functions of the R statistical software was developed to calculate the CCC with aim to be a tool for researchers find the most appropriate method of cluster analysis for their data set.Biblioteca Digitais de Teses e Dissertações da USPMunita, Casimiro Jaime Alfredo SepúlvedaCarvalho, Priscilla Ramos2018-09-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/85/85131/tde-31102018-112210/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-04-10T00:06:19Zoai:teses.usp.br:tde-31102018-112210Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-04-10T00:06:19Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
Comparative study of hierarchical algorithms of cluster analysis in experimental results
title Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
spellingShingle Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
Carvalho, Priscilla Ramos
análise de agrupamentos
Archaeometry
Arqueometria
cluster analysis
Coeficiente de Correlação Cofenética
Cophenetic Correlation Coefficient
hierarchical methods
INAA
INAA
métodos hierárquicos
title_short Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
title_full Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
title_fullStr Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
title_full_unstemmed Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
title_sort Estudo comparativo dos algoritmos hierárquicos de análise de agrupamentos em resultados experimentais
author Carvalho, Priscilla Ramos
author_facet Carvalho, Priscilla Ramos
author_role author
dc.contributor.none.fl_str_mv Munita, Casimiro Jaime Alfredo Sepúlveda
dc.contributor.author.fl_str_mv Carvalho, Priscilla Ramos
dc.subject.por.fl_str_mv análise de agrupamentos
Archaeometry
Arqueometria
cluster analysis
Coeficiente de Correlação Cofenética
Cophenetic Correlation Coefficient
hierarchical methods
INAA
INAA
métodos hierárquicos
topic análise de agrupamentos
Archaeometry
Arqueometria
cluster analysis
Coeficiente de Correlação Cofenética
Cophenetic Correlation Coefficient
hierarchical methods
INAA
INAA
métodos hierárquicos
description Objetivou-se, com este trabalho, estudar os métodos hierárquicos de análise de agrupamentos (ligação simples, ligação completa, ligação média, centróide e de Ward com base nas distâncias Euclidiana, Euclidiana ao quadrado, Manhattan e Mahalanobis), de modo a identificar qual é o mais adequado para uma base de dados arqueológicos. Utilizou-se uma base de dados fornecida pelo Grupo de Estudos Arqueométricos do IPEN CNEN/SP, na qual foram analisadas 146 amostras de fragmentos cerâmicos de três sítios arqueológicos por análise por ativação com nêutrons instrumental, sendo determinadas as frações de massa de 24 elementos químicos: As, Ba, Ce, Co, Cr, Cs, Eu, Fe, Hf, K, La, Lu, Na, Nd, Rb, Sb, Sc, Sm, Ta, Tb, Th, U, Yb e Zn. Para a determinação do melhor método, foram avaliados os dendrogramas conjuntamente com o valor dos coeficientes de correlação cofenética (CCC), obtidos para cada método. O método da ligação média mostrou-se mais coerente na formação dos agrupamentos, apresentando também os maiores valores do CCC. Por último, um script com funções do programa estatístico R foi desenvolvido para calcular o CCC, com o intuito de auxiliar os pesquisadores a encontrar o método de agrupamento mais apropriado para sua base de dados.
publishDate 2018
dc.date.none.fl_str_mv 2018-09-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/85/85131/tde-31102018-112210/
url http://www.teses.usp.br/teses/disponiveis/85/85131/tde-31102018-112210/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257519752216576