Inferência em agrupamento considerando múltiplos grupos

Detalhes bibliográficos
Autor(a) principal: Bello, Débora Zava
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/237728
Resumo: Métodos de agrupamento são ferramentas úteis na identificação de padrões em conjuntos de dados. No contexto de alta dimensionalidade e tamanho amostral pequeno, o desafio de decidir se o agrupamento encontrado é estatisticamente significativo é ainda maior. Entre os métodos de agrupamento adequados à esse contexto, poucos possuem inferência e muitas vezes são específicos para dois grupos. Estamos propondo um método para agrupar de forma ótima em mais conjuntos, nesse caso três. Além de uma abordagem para clusterização dos elementos em três grupos, propomos um teste de homogeneidade para verificar a sua significância. Apresentamos a estatística de teste, suas propriedades assintóticas e, através de simulações, estudamos propriedades como tamanho e poder do teste proposto. Comparações com outras metodologias binárias indicam que nossa proposta é mais adequada para situações em que os dados têm uma estrutura inerente de três grupos.
id URGS_e66a72ffea4842260d1c5bb52019a54b
oai_identifier_str oai:www.lume.ufrgs.br:10183/237728
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Bello, Débora ZavaValk, MárcioCybis, Gabriela Bettella2022-04-25T11:11:46Z2021http://hdl.handle.net/10183/237728001139254Métodos de agrupamento são ferramentas úteis na identificação de padrões em conjuntos de dados. No contexto de alta dimensionalidade e tamanho amostral pequeno, o desafio de decidir se o agrupamento encontrado é estatisticamente significativo é ainda maior. Entre os métodos de agrupamento adequados à esse contexto, poucos possuem inferência e muitas vezes são específicos para dois grupos. Estamos propondo um método para agrupar de forma ótima em mais conjuntos, nesse caso três. Além de uma abordagem para clusterização dos elementos em três grupos, propomos um teste de homogeneidade para verificar a sua significância. Apresentamos a estatística de teste, suas propriedades assintóticas e, através de simulações, estudamos propriedades como tamanho e poder do teste proposto. Comparações com outras metodologias binárias indicam que nossa proposta é mais adequada para situações em que os dados têm uma estrutura inerente de três grupos.Inference in clustering is paramount to uncovering inherent group structure in the data. Clustering methods which assess statistical significance have recently drawn attention owing to their importance for the identification of patterns in high dimensional data with applications in many scientific fields. We present here a U-statistics based approach, specially tailored for high-dimensional data, that clusters the data into three groups while assessing the significance of such partitions. Because our approach stands on the U-statistics based clustering framework of uclust, it inherits its characteristics being a non-parametric method relying on very few assumptions about the data, and thus can be applied to a wide range of dataset. Furthermore our method aims to be a more powerful tool to find the best partitions of the data into three groups when that particular structure is present. In order to do so, we first propose an extension of the test U-statistic and develop its asymptotic theory. Additionally we propose a ternary non-nested significance clustering method. Our approach is tested through multiple simulations and found to have more statistical power than competing alternatives in all scenarios considered. An application to image recognition shows that our proposal presents a superior performance for this special case.application/pdfporClusterInferenciaMetodos de agrupamentoInferência em agrupamento considerando múltiplos gruposClustering inference in multiple groups info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPrograma de Pós-Graduação em EstatísticaPorto Alegre, BR-RS2021mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001139254.pdf.txt001139254.pdf.txtExtracted Texttext/plain100686http://www.lume.ufrgs.br/bitstream/10183/237728/2/001139254.pdf.txte5df4c79a1c8b0a2188889673511a3dfMD52ORIGINAL001139254.pdfTexto completoapplication/pdf827183http://www.lume.ufrgs.br/bitstream/10183/237728/1/001139254.pdf5a4767d7305226fefdd8f69e082c40dbMD5110183/2377282022-04-26 04:50:24.345oai:www.lume.ufrgs.br:10183/237728Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-04-26T07:50:24Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Inferência em agrupamento considerando múltiplos grupos
dc.title.alternative.en.fl_str_mv Clustering inference in multiple groups
title Inferência em agrupamento considerando múltiplos grupos
spellingShingle Inferência em agrupamento considerando múltiplos grupos
Bello, Débora Zava
Cluster
Inferencia
Metodos de agrupamento
title_short Inferência em agrupamento considerando múltiplos grupos
title_full Inferência em agrupamento considerando múltiplos grupos
title_fullStr Inferência em agrupamento considerando múltiplos grupos
title_full_unstemmed Inferência em agrupamento considerando múltiplos grupos
title_sort Inferência em agrupamento considerando múltiplos grupos
author Bello, Débora Zava
author_facet Bello, Débora Zava
author_role author
dc.contributor.author.fl_str_mv Bello, Débora Zava
dc.contributor.advisor1.fl_str_mv Valk, Márcio
dc.contributor.advisor-co1.fl_str_mv Cybis, Gabriela Bettella
contributor_str_mv Valk, Márcio
Cybis, Gabriela Bettella
dc.subject.por.fl_str_mv Cluster
Inferencia
Metodos de agrupamento
topic Cluster
Inferencia
Metodos de agrupamento
description Métodos de agrupamento são ferramentas úteis na identificação de padrões em conjuntos de dados. No contexto de alta dimensionalidade e tamanho amostral pequeno, o desafio de decidir se o agrupamento encontrado é estatisticamente significativo é ainda maior. Entre os métodos de agrupamento adequados à esse contexto, poucos possuem inferência e muitas vezes são específicos para dois grupos. Estamos propondo um método para agrupar de forma ótima em mais conjuntos, nesse caso três. Além de uma abordagem para clusterização dos elementos em três grupos, propomos um teste de homogeneidade para verificar a sua significância. Apresentamos a estatística de teste, suas propriedades assintóticas e, através de simulações, estudamos propriedades como tamanho e poder do teste proposto. Comparações com outras metodologias binárias indicam que nossa proposta é mais adequada para situações em que os dados têm uma estrutura inerente de três grupos.
publishDate 2021
dc.date.issued.fl_str_mv 2021
dc.date.accessioned.fl_str_mv 2022-04-25T11:11:46Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/237728
dc.identifier.nrb.pt_BR.fl_str_mv 001139254
url http://hdl.handle.net/10183/237728
identifier_str_mv 001139254
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/237728/2/001139254.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/237728/1/001139254.pdf
bitstream.checksum.fl_str_mv e5df4c79a1c8b0a2188889673511a3df
5a4767d7305226fefdd8f69e082c40db
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085582867529728