Proposição de testes de normalidade multivariada baseados em distâncias robustas

Detalhes bibliográficos
Autor(a) principal: Pereira, Érica Aparecida
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFLA
Texto Completo: http://repositorio.ufla.br/jspui/handle/1/13413
Resumo: Multivariate normality is one of the most important assumptions for the realization of many inferential methods. The non-verification of this assumption can influence the reliability of the results. There are many tests in the specialized literature to verify normality. In the case of multivariate normality, the tests, in general, are based on correlation coefficients, asymmetry and kurtosis coefficients and distances. Despite the large number of tests, there is no test in the literature that is uniformly more powerful in all evaluated situations. The tests, in general, presents some restrictions, both in relation to size and to dimension. The presence of outliers in the data can result in bad parameter estimation and even distortions in the distribution fitting, making the tests fail. Therefore, the aim of this work is to propose and evaluate four outlier robust tests: multivariate normality test based on Mahalanobis distance with robust measures of the scale and location parameters (TNMD2RKS), multivariate normality test based on robust beta distance (TNMDbRKS), parametric bootstrap multivariate normality test based on robust distances (TNMD2RBoot) and the parametric bootstrap multivariate normality test based on robust beta distances (TNMDbRBoot). For the four tests it was used the robust scale and location estimators calculated via function CovOgk from the R software. Type I error rates and power of the tests were evaluated by comparing then to the parametric bootstrap multivariate normality test based on the correlation between the order statistics and the expected values and the Royston’s Shapiro-Wilk test, via Monte Carlo simulation. The tests TNMD2RKS, TNMD2RBoot and TNMDbRBoot were successfully proposed, obtaining excellent type I error rate control, especially in samples with the presence of outliers, in which the other tests did not perform well. In terms of power, the four tests performed well in large samples, however, they did not outperform the tests used as references.
id UFLA_775ba13771d9eed3589cc89e2d122e7b
oai_identifier_str oai:localhost:1/13413
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling Proposição de testes de normalidade multivariada baseados em distâncias robustasMultivariate normality tests proposition based on robust distancesNormalidade multivariadaEstimadores robustosDistância de MahalanobisMétodos inferenciaisMultivariate normalityOutliersMahalanobis distanceInferential methodsEstatísticaMultivariate normality is one of the most important assumptions for the realization of many inferential methods. The non-verification of this assumption can influence the reliability of the results. There are many tests in the specialized literature to verify normality. In the case of multivariate normality, the tests, in general, are based on correlation coefficients, asymmetry and kurtosis coefficients and distances. Despite the large number of tests, there is no test in the literature that is uniformly more powerful in all evaluated situations. The tests, in general, presents some restrictions, both in relation to size and to dimension. The presence of outliers in the data can result in bad parameter estimation and even distortions in the distribution fitting, making the tests fail. Therefore, the aim of this work is to propose and evaluate four outlier robust tests: multivariate normality test based on Mahalanobis distance with robust measures of the scale and location parameters (TNMD2RKS), multivariate normality test based on robust beta distance (TNMDbRKS), parametric bootstrap multivariate normality test based on robust distances (TNMD2RBoot) and the parametric bootstrap multivariate normality test based on robust beta distances (TNMDbRBoot). For the four tests it was used the robust scale and location estimators calculated via function CovOgk from the R software. Type I error rates and power of the tests were evaluated by comparing then to the parametric bootstrap multivariate normality test based on the correlation between the order statistics and the expected values and the Royston’s Shapiro-Wilk test, via Monte Carlo simulation. The tests TNMD2RKS, TNMD2RBoot and TNMDbRBoot were successfully proposed, obtaining excellent type I error rate control, especially in samples with the presence of outliers, in which the other tests did not perform well. In terms of power, the four tests performed well in large samples, however, they did not outperform the tests used as references.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)A normalidade multivariada é uma das pressuposições mais importante para a realização de muitos métodos inferenciais. A não verificação desta pressuposição pode influenciar na confiabilidade dos resultados. Existem muitos testes na literatura especializada para verificar a normalidade. No caso da normalidade multivariada, os testes, em geral, são baseados nos coeficientes de correlação, coeficiente de assimetria e curtose e distâncias. Apesar do grande número de testes, não existe na literatura um que seja uniformemente mais poderoso em todas as situações avaliadas. Os testes, em geral, apresentam alguma restrição, tanto em relação ao tamanho da amostra quanto à dimensão. Se os dados apresentam observações discrepantes, então podem ocorrer estimativas dos parâmetros precárias e até mesmo distorção no ajuste da distribuição, fazendo com que os testes falhem. Assim sendo, este trabalho tem como objetivo propor e avaliar quatro testes robustos quanto à presença de outliers: teste de normalidade multivariada baseado em distância de Mahalanobis com medidas robustas dos parâmetros de locação e escala (TNMD2RKS), teste de normalidade multivariada baseado em distância beta robusta (TNMDbRKS), teste de normalidade multivariada bootstrap paramétrico baseado em distâncias robustas (TNMD2RBoot) e o teste de normalidade multivariada bootstrap paramétrico baseado em distâncias beta robustas (TNMDbRBoot). Para os quatro testes foram utilizados os estimadores de locação e escala robustos calculados por meio da função CovOgk do So ftware R. Foram avaliadas as taxas de erro tipo I e o poder dos testes propostos comparando-os com o teste de normalidade multivariada baseado em bootstrap paramétrico na correlação entre as estatística de ordem e seus valores esperados e com o teste de Shapiro-Wilk de Royston, por meio de simulação Monte Carlo. Os testes TNMD2RKS, TNMD2RBoot e TNMDbRBoot foram propostos com sucesso, os quais obtiveram excelente controle da taxa de erro tipo I, principalmente em amostras com presença de outliers, em que os demais testes não obtiveram controle. Quanto ao poder, os quatro testes obtiveram bom desempenho em grandes amostras, porém não superaramo desempenho dos testes usados como referência.Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilDepartamento de Ciências ExatasFerreira, Daniel FurtadoFerreira, Daniel FurtadoBueno Filho, Júlio Sílvio de SousaPereira, Tiago MartinsPereira, Érica Aparecida2017-07-25T16:59:39Z2017-07-25T16:59:39Z2017-07-212017-04-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPEREIRA, E. A. Proposição de testes de normalidade multivariada baseados em distâncias robustas. 2017. 105 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2017.http://repositorio.ufla.br/jspui/handle/1/13413porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2017-07-25T16:59:39Zoai:localhost:1/13413Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2017-07-25T16:59:39Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false
dc.title.none.fl_str_mv Proposição de testes de normalidade multivariada baseados em distâncias robustas
Multivariate normality tests proposition based on robust distances
title Proposição de testes de normalidade multivariada baseados em distâncias robustas
spellingShingle Proposição de testes de normalidade multivariada baseados em distâncias robustas
Pereira, Érica Aparecida
Normalidade multivariada
Estimadores robustos
Distância de Mahalanobis
Métodos inferenciais
Multivariate normality
Outliers
Mahalanobis distance
Inferential methods
Estatística
title_short Proposição de testes de normalidade multivariada baseados em distâncias robustas
title_full Proposição de testes de normalidade multivariada baseados em distâncias robustas
title_fullStr Proposição de testes de normalidade multivariada baseados em distâncias robustas
title_full_unstemmed Proposição de testes de normalidade multivariada baseados em distâncias robustas
title_sort Proposição de testes de normalidade multivariada baseados em distâncias robustas
author Pereira, Érica Aparecida
author_facet Pereira, Érica Aparecida
author_role author
dc.contributor.none.fl_str_mv Ferreira, Daniel Furtado
Ferreira, Daniel Furtado
Bueno Filho, Júlio Sílvio de Sousa
Pereira, Tiago Martins
dc.contributor.author.fl_str_mv Pereira, Érica Aparecida
dc.subject.por.fl_str_mv Normalidade multivariada
Estimadores robustos
Distância de Mahalanobis
Métodos inferenciais
Multivariate normality
Outliers
Mahalanobis distance
Inferential methods
Estatística
topic Normalidade multivariada
Estimadores robustos
Distância de Mahalanobis
Métodos inferenciais
Multivariate normality
Outliers
Mahalanobis distance
Inferential methods
Estatística
description Multivariate normality is one of the most important assumptions for the realization of many inferential methods. The non-verification of this assumption can influence the reliability of the results. There are many tests in the specialized literature to verify normality. In the case of multivariate normality, the tests, in general, are based on correlation coefficients, asymmetry and kurtosis coefficients and distances. Despite the large number of tests, there is no test in the literature that is uniformly more powerful in all evaluated situations. The tests, in general, presents some restrictions, both in relation to size and to dimension. The presence of outliers in the data can result in bad parameter estimation and even distortions in the distribution fitting, making the tests fail. Therefore, the aim of this work is to propose and evaluate four outlier robust tests: multivariate normality test based on Mahalanobis distance with robust measures of the scale and location parameters (TNMD2RKS), multivariate normality test based on robust beta distance (TNMDbRKS), parametric bootstrap multivariate normality test based on robust distances (TNMD2RBoot) and the parametric bootstrap multivariate normality test based on robust beta distances (TNMDbRBoot). For the four tests it was used the robust scale and location estimators calculated via function CovOgk from the R software. Type I error rates and power of the tests were evaluated by comparing then to the parametric bootstrap multivariate normality test based on the correlation between the order statistics and the expected values and the Royston’s Shapiro-Wilk test, via Monte Carlo simulation. The tests TNMD2RKS, TNMD2RBoot and TNMDbRBoot were successfully proposed, obtaining excellent type I error rate control, especially in samples with the presence of outliers, in which the other tests did not perform well. In terms of power, the four tests performed well in large samples, however, they did not outperform the tests used as references.
publishDate 2017
dc.date.none.fl_str_mv 2017-07-25T16:59:39Z
2017-07-25T16:59:39Z
2017-07-21
2017-04-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PEREIRA, E. A. Proposição de testes de normalidade multivariada baseados em distâncias robustas. 2017. 105 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2017.
http://repositorio.ufla.br/jspui/handle/1/13413
identifier_str_mv PEREIRA, E. A. Proposição de testes de normalidade multivariada baseados em distâncias robustas. 2017. 105 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2017.
url http://repositorio.ufla.br/jspui/handle/1/13413
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Lavras
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
UFLA
brasil
Departamento de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal de Lavras
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
UFLA
brasil
Departamento de Ciências Exatas
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1807835048398815232