Proposição de testes de normalidade multivariada baseados em distâncias robustas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFLA |
Texto Completo: | http://repositorio.ufla.br/jspui/handle/1/13413 |
Resumo: | Multivariate normality is one of the most important assumptions for the realization of many inferential methods. The non-verification of this assumption can influence the reliability of the results. There are many tests in the specialized literature to verify normality. In the case of multivariate normality, the tests, in general, are based on correlation coefficients, asymmetry and kurtosis coefficients and distances. Despite the large number of tests, there is no test in the literature that is uniformly more powerful in all evaluated situations. The tests, in general, presents some restrictions, both in relation to size and to dimension. The presence of outliers in the data can result in bad parameter estimation and even distortions in the distribution fitting, making the tests fail. Therefore, the aim of this work is to propose and evaluate four outlier robust tests: multivariate normality test based on Mahalanobis distance with robust measures of the scale and location parameters (TNMD2RKS), multivariate normality test based on robust beta distance (TNMDbRKS), parametric bootstrap multivariate normality test based on robust distances (TNMD2RBoot) and the parametric bootstrap multivariate normality test based on robust beta distances (TNMDbRBoot). For the four tests it was used the robust scale and location estimators calculated via function CovOgk from the R software. Type I error rates and power of the tests were evaluated by comparing then to the parametric bootstrap multivariate normality test based on the correlation between the order statistics and the expected values and the Royston’s Shapiro-Wilk test, via Monte Carlo simulation. The tests TNMD2RKS, TNMD2RBoot and TNMDbRBoot were successfully proposed, obtaining excellent type I error rate control, especially in samples with the presence of outliers, in which the other tests did not perform well. In terms of power, the four tests performed well in large samples, however, they did not outperform the tests used as references. |
id |
UFLA_775ba13771d9eed3589cc89e2d122e7b |
---|---|
oai_identifier_str |
oai:localhost:1/13413 |
network_acronym_str |
UFLA |
network_name_str |
Repositório Institucional da UFLA |
repository_id_str |
|
spelling |
Proposição de testes de normalidade multivariada baseados em distâncias robustasMultivariate normality tests proposition based on robust distancesNormalidade multivariadaEstimadores robustosDistância de MahalanobisMétodos inferenciaisMultivariate normalityOutliersMahalanobis distanceInferential methodsEstatísticaMultivariate normality is one of the most important assumptions for the realization of many inferential methods. The non-verification of this assumption can influence the reliability of the results. There are many tests in the specialized literature to verify normality. In the case of multivariate normality, the tests, in general, are based on correlation coefficients, asymmetry and kurtosis coefficients and distances. Despite the large number of tests, there is no test in the literature that is uniformly more powerful in all evaluated situations. The tests, in general, presents some restrictions, both in relation to size and to dimension. The presence of outliers in the data can result in bad parameter estimation and even distortions in the distribution fitting, making the tests fail. Therefore, the aim of this work is to propose and evaluate four outlier robust tests: multivariate normality test based on Mahalanobis distance with robust measures of the scale and location parameters (TNMD2RKS), multivariate normality test based on robust beta distance (TNMDbRKS), parametric bootstrap multivariate normality test based on robust distances (TNMD2RBoot) and the parametric bootstrap multivariate normality test based on robust beta distances (TNMDbRBoot). For the four tests it was used the robust scale and location estimators calculated via function CovOgk from the R software. Type I error rates and power of the tests were evaluated by comparing then to the parametric bootstrap multivariate normality test based on the correlation between the order statistics and the expected values and the Royston’s Shapiro-Wilk test, via Monte Carlo simulation. The tests TNMD2RKS, TNMD2RBoot and TNMDbRBoot were successfully proposed, obtaining excellent type I error rate control, especially in samples with the presence of outliers, in which the other tests did not perform well. In terms of power, the four tests performed well in large samples, however, they did not outperform the tests used as references.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)A normalidade multivariada é uma das pressuposições mais importante para a realização de muitos métodos inferenciais. A não verificação desta pressuposição pode influenciar na confiabilidade dos resultados. Existem muitos testes na literatura especializada para verificar a normalidade. No caso da normalidade multivariada, os testes, em geral, são baseados nos coeficientes de correlação, coeficiente de assimetria e curtose e distâncias. Apesar do grande número de testes, não existe na literatura um que seja uniformemente mais poderoso em todas as situações avaliadas. Os testes, em geral, apresentam alguma restrição, tanto em relação ao tamanho da amostra quanto à dimensão. Se os dados apresentam observações discrepantes, então podem ocorrer estimativas dos parâmetros precárias e até mesmo distorção no ajuste da distribuição, fazendo com que os testes falhem. Assim sendo, este trabalho tem como objetivo propor e avaliar quatro testes robustos quanto à presença de outliers: teste de normalidade multivariada baseado em distância de Mahalanobis com medidas robustas dos parâmetros de locação e escala (TNMD2RKS), teste de normalidade multivariada baseado em distância beta robusta (TNMDbRKS), teste de normalidade multivariada bootstrap paramétrico baseado em distâncias robustas (TNMD2RBoot) e o teste de normalidade multivariada bootstrap paramétrico baseado em distâncias beta robustas (TNMDbRBoot). Para os quatro testes foram utilizados os estimadores de locação e escala robustos calculados por meio da função CovOgk do So ftware R. Foram avaliadas as taxas de erro tipo I e o poder dos testes propostos comparando-os com o teste de normalidade multivariada baseado em bootstrap paramétrico na correlação entre as estatística de ordem e seus valores esperados e com o teste de Shapiro-Wilk de Royston, por meio de simulação Monte Carlo. Os testes TNMD2RKS, TNMD2RBoot e TNMDbRBoot foram propostos com sucesso, os quais obtiveram excelente controle da taxa de erro tipo I, principalmente em amostras com presença de outliers, em que os demais testes não obtiveram controle. Quanto ao poder, os quatro testes obtiveram bom desempenho em grandes amostras, porém não superaramo desempenho dos testes usados como referência.Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilDepartamento de Ciências ExatasFerreira, Daniel FurtadoFerreira, Daniel FurtadoBueno Filho, Júlio Sílvio de SousaPereira, Tiago MartinsPereira, Érica Aparecida2017-07-25T16:59:39Z2017-07-25T16:59:39Z2017-07-212017-04-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPEREIRA, E. A. Proposição de testes de normalidade multivariada baseados em distâncias robustas. 2017. 105 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2017.http://repositorio.ufla.br/jspui/handle/1/13413porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2017-07-25T16:59:39Zoai:localhost:1/13413Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2017-07-25T16:59:39Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false |
dc.title.none.fl_str_mv |
Proposição de testes de normalidade multivariada baseados em distâncias robustas Multivariate normality tests proposition based on robust distances |
title |
Proposição de testes de normalidade multivariada baseados em distâncias robustas |
spellingShingle |
Proposição de testes de normalidade multivariada baseados em distâncias robustas Pereira, Érica Aparecida Normalidade multivariada Estimadores robustos Distância de Mahalanobis Métodos inferenciais Multivariate normality Outliers Mahalanobis distance Inferential methods Estatística |
title_short |
Proposição de testes de normalidade multivariada baseados em distâncias robustas |
title_full |
Proposição de testes de normalidade multivariada baseados em distâncias robustas |
title_fullStr |
Proposição de testes de normalidade multivariada baseados em distâncias robustas |
title_full_unstemmed |
Proposição de testes de normalidade multivariada baseados em distâncias robustas |
title_sort |
Proposição de testes de normalidade multivariada baseados em distâncias robustas |
author |
Pereira, Érica Aparecida |
author_facet |
Pereira, Érica Aparecida |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ferreira, Daniel Furtado Ferreira, Daniel Furtado Bueno Filho, Júlio Sílvio de Sousa Pereira, Tiago Martins |
dc.contributor.author.fl_str_mv |
Pereira, Érica Aparecida |
dc.subject.por.fl_str_mv |
Normalidade multivariada Estimadores robustos Distância de Mahalanobis Métodos inferenciais Multivariate normality Outliers Mahalanobis distance Inferential methods Estatística |
topic |
Normalidade multivariada Estimadores robustos Distância de Mahalanobis Métodos inferenciais Multivariate normality Outliers Mahalanobis distance Inferential methods Estatística |
description |
Multivariate normality is one of the most important assumptions for the realization of many inferential methods. The non-verification of this assumption can influence the reliability of the results. There are many tests in the specialized literature to verify normality. In the case of multivariate normality, the tests, in general, are based on correlation coefficients, asymmetry and kurtosis coefficients and distances. Despite the large number of tests, there is no test in the literature that is uniformly more powerful in all evaluated situations. The tests, in general, presents some restrictions, both in relation to size and to dimension. The presence of outliers in the data can result in bad parameter estimation and even distortions in the distribution fitting, making the tests fail. Therefore, the aim of this work is to propose and evaluate four outlier robust tests: multivariate normality test based on Mahalanobis distance with robust measures of the scale and location parameters (TNMD2RKS), multivariate normality test based on robust beta distance (TNMDbRKS), parametric bootstrap multivariate normality test based on robust distances (TNMD2RBoot) and the parametric bootstrap multivariate normality test based on robust beta distances (TNMDbRBoot). For the four tests it was used the robust scale and location estimators calculated via function CovOgk from the R software. Type I error rates and power of the tests were evaluated by comparing then to the parametric bootstrap multivariate normality test based on the correlation between the order statistics and the expected values and the Royston’s Shapiro-Wilk test, via Monte Carlo simulation. The tests TNMD2RKS, TNMD2RBoot and TNMDbRBoot were successfully proposed, obtaining excellent type I error rate control, especially in samples with the presence of outliers, in which the other tests did not perform well. In terms of power, the four tests performed well in large samples, however, they did not outperform the tests used as references. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-07-25T16:59:39Z 2017-07-25T16:59:39Z 2017-07-21 2017-04-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
PEREIRA, E. A. Proposição de testes de normalidade multivariada baseados em distâncias robustas. 2017. 105 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2017. http://repositorio.ufla.br/jspui/handle/1/13413 |
identifier_str_mv |
PEREIRA, E. A. Proposição de testes de normalidade multivariada baseados em distâncias robustas. 2017. 105 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2017. |
url |
http://repositorio.ufla.br/jspui/handle/1/13413 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Lavras Programa de Pós-Graduação em Estatística e Experimentação Agropecuária UFLA brasil Departamento de Ciências Exatas |
publisher.none.fl_str_mv |
Universidade Federal de Lavras Programa de Pós-Graduação em Estatística e Experimentação Agropecuária UFLA brasil Departamento de Ciências Exatas |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
instname_str |
Universidade Federal de Lavras (UFLA) |
instacron_str |
UFLA |
institution |
UFLA |
reponame_str |
Repositório Institucional da UFLA |
collection |
Repositório Institucional da UFLA |
repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
_version_ |
1815438947833085952 |