Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas

Silva, Alex Pena Tosta da

Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas

Detalhes bibliográficos
Autor(a) principal:	Silva, Alex Pena Tosta da
Data de Publicação:	2012
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UnB
Texto Completo:	http://repositorio.unb.br/handle/10482/11522
Resumo:	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2012.

Metadados do item

id	UNB_a7453fb7c2ec58aea8d8702a696b2ce6
oai_identifier_str	oai:repositorio.unb.br:10482/11522
network_acronym_str	UNB
network_name_str	Repositório Institucional da UnB
repository_id_str
spelling	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenasAnálise por conglomeradosAlgoritmosDissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2012.Este trabalho analisa uma série de algoritmos destinados a agrupar variáveis em uma estrutura de dadossuperdimensionada, longitudinal e com amostras pequenas (do inglês, High Dimensional Longitudinal Low Sample Size - HDLLSS). Esses algoritmos utilizam como medida de similaridade o p-valor resultante de um teste de ausência de efeito simples de grupo em um delineamento fatorial com medidas repetidas no tempo. Os testes não-paramétricos presentes em cada algoritmo serão estudados extensivamente por meio de simulações do erro do tipo I e curvas de poder do teste. Pesquisa bibliográfica dos métodos de agrupamento de dados HDLLSS mostra que a estimação da matriz de covariância é um grande problema em vários algoritmos. Neste trabalho, todas as simulações consideraram três formas distintas de estimação dessa matriz: [símbolo matemático de soma, sigma]i, [símbolo matemático de soma, sigma] e [símbolo matemático de soma, sigma]G. Enquanto [símbolo matemático de soma, sigma]i utiliza as informações da i-ésima variável para estimar as matrizes, [símbolo matemático de soma, sigma] utiliza todas as variáveis para a estimação de uma única matriz de covariâncias. O terceiro método considerado, [símbolo matemático de soma, sigma]G, estima uma matriz de covariâncias para cada grupo. Esse método apresentou melhores resultados por conseguir detectar a variabilidade entre os grupos com informação suficiente para uma boa qualidade de estimação. Aplicações em dados de microarranjo e em sinais de eletroencefalograma (EEG) apresentam resultados promissores. Os estudos de simulação sugerem que os algoritmos de agrupamento propostos superam os métodos existentes na literatura destinados a detectar grupos em dados HDLLSS. Além disso, esses algoritmos possuem propriedades desejáveis como invariância a transformações monótonas nos dados e detecção automática do número de grupos amostrais. ______________________________________________________________________________ ABSTRACTThis dissertation analyses a set of algorithms to cluster variables in high dimensional longitudinal low sample size (HDLLSS) data.These algorithms are based on the use of a pvalue from a non parametric test of no simple eﬀect of group as a similarity measure for the clustering procedure. The non parametric-tests in each algorithm were studied extensively by means of simulations of type I error and power curves. Investigation of recente literatura in HDLLSS clustering algorithms shows that the covariance matrix estimation is a major problem. In this work, all simulations used three diﬀerent ways of covariance matrix estimation: Σi,ΣandΣG. While Σi uses information from the ith variable to estimate covariance matrices, Σ uses all variables for estimating a single covariance matrix for the data.The third method considered, ΣG,estimates one covariance matrix for each group. This estimation methods hows better results because it can detect the variability between the groups with suﬃcient information for ago odquality estimation of time covariance structure. Applications on micro array data and electroencephalogram(EEG) signals show promising results.The simulation studies reveal that the proposed clustering algorithms out performs existing methods in the literature applied for detecting groups of HDLLSS data exhibiting high clustering accuracy and stability. Furthermore, these algorithms have desirable properties as invariance under monotone transformations and automatic detection of the number of sample groups.Instituto de Ciências Exatas (IE)Departamento de Estatística (IE EST)Programa de Pós-Graduação em EstatísticaBorries, George Freitas vonSilva, Alex Pena Tosta da2012-10-30T09:44:05Z2012-10-30T09:44:05Z2012-10-302012-06-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Alex Pena Tosta da. Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas. 2012. ii, 97 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2012.http://repositorio.unb.br/handle/10482/11522A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-01T16:22:40Zoai:repositorio.unb.br:10482/11522Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-01T16:22:40Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas
title	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas
spellingShingle	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas Silva, Alex Pena Tosta da Análise por conglomerados Algoritmos
title_short	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas
title_full	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas
title_fullStr	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas
title_full_unstemmed	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas
title_sort	Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas
author	Silva, Alex Pena Tosta da
author_facet	Silva, Alex Pena Tosta da
author_role	author
dc.contributor.none.fl_str_mv	Borries, George Freitas von
dc.contributor.author.fl_str_mv	Silva, Alex Pena Tosta da
dc.subject.por.fl_str_mv	Análise por conglomerados Algoritmos
topic	Análise por conglomerados Algoritmos
description	Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2012.
publishDate	2012
dc.date.none.fl_str_mv	2012-10-30T09:44:05Z 2012-10-30T09:44:05Z 2012-10-30 2012-06-15
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	SILVA, Alex Pena Tosta da. Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas. 2012. ii, 97 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2012. http://repositorio.unb.br/handle/10482/11522
identifier_str_mv	SILVA, Alex Pena Tosta da. Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas. 2012. ii, 97 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2012.
url	http://repositorio.unb.br/handle/10482/11522
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB
instname_str	Universidade de Brasília (UnB)
instacron_str	UNB
institution	UNB
reponame_str	Repositório Institucional da UnB
collection	Repositório Institucional da UnB
repository.name.fl_str_mv	Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv	repositorio@unb.br
_version_	1810580924945924096

Implementação, análise e aplicação de algoritmos de agrupamento de dados superdimensionados, longitudinais e com amostras pequenas

Registros relacionados