Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNESP |
Texto Completo: | http://hdl.handle.net/11449/213630 |
Resumo: | Em experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral. |
id |
UNSP_05d5dba0aaf95e782056bb1e088a9bef |
---|---|
oai_identifier_str |
oai:repositorio.unesp.br:11449/213630 |
network_acronym_str |
UNSP |
network_name_str |
Repositório Institucional da UNESP |
repository_id_str |
2946 |
spelling |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistosCovariance models for repeated measures: a simulation study on fit, error, and statistical power in linear mixed modelosTeste F Modelos de covariânciaRobustezDados correlacionadosErro do tipo IPoder estatísticoCritérios de seleçãoSimulaçãoF testCovariance modelsRobustnessCorrelated dataType I errorStatistical powerInformation criteriaSimulationEm experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.The premise in experiments with repeated measures is that observations taken in the same experimental unit are correlated and that correlations decrease proportionally to the increase in the distance between measurements in time or space. Nevertheless, these experiments are often analyzed as if the correlations between the repeated measures were constant or using methods that only consider correlations different, which may impact on the rejection rate of the null hypothesis, and ultimately type I error rate and statistical power. In this context, the present study investigated the application of mixed linear models with different assumptions about the covariance matrix in data sets from simulated experiments with repeated measures. 84 scenarios that varied in terms of the covariance matrix pattern (14 structures), number of repeated measurements (4 and 8) and sample size (4, 8 and 12) were evaluated. 10,000 datasets were simulated for each scenario based on a multivariate normal distribution and were subsequently analyzed using mixed linear models. Type I error rate and statistical power for the hypothesis test of the interaction between treatments and repeated measures were estimated as the proportion of p values less than or equal to 0.01 or 0.05 out of a total of 10,000 tests for each scenario. The models were also evaluated for their ability to fit the data using Bayesian Information Criteria (BIC). Thus, the frequency with which the covariance structures were chosen by the selection criteria was computed. Results indicate that the assumption chosen most frequently by the information criteria resulted from the specified covariance structure that corresponded to the empirical covariance structure of the analyzed data sets, particularly for those with larger number of repeated measures and sample sizes. Results also indicate that the use of covariance models that do not recognize heterogeneous correlations between repeated measures can inflate type I error or reduce it to very conservative levels, which may affect the conclusion of agricultural experiments. For a 5% significance level, type I error bias was greater than 2α, while for 1% significance level, bias was over 4α. In addition, the statistical power was reduced when the assumption about the covariance matrix of the data sets did not correspond to the empirical covariance structure, particularly for those datasets with a smaller sample size.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Universidade Estadual Paulista (Unesp)Sartori, Maria Márcia PereiraGodoy, Rodolfo [UNESP]Universidade Estadual Paulista (Unesp)Vieira, Lucas Vasconcelos2021-07-26T13:55:59Z2021-07-26T13:55:59Z2021-05-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/11449/21363033004064039P3porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-05-02T19:49:14Zoai:repositorio.unesp.br:11449/213630Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T13:58:46.506836Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false |
dc.title.none.fl_str_mv |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos Covariance models for repeated measures: a simulation study on fit, error, and statistical power in linear mixed modelos |
title |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos |
spellingShingle |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos Vieira, Lucas Vasconcelos Teste F Modelos de covariância Robustez Dados correlacionados Erro do tipo I Poder estatístico Critérios de seleção Simulação F test Covariance models Robustness Correlated data Type I error Statistical power Information criteria Simulation |
title_short |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos |
title_full |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos |
title_fullStr |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos |
title_full_unstemmed |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos |
title_sort |
Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos |
author |
Vieira, Lucas Vasconcelos |
author_facet |
Vieira, Lucas Vasconcelos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Sartori, Maria Márcia Pereira Godoy, Rodolfo [UNESP] Universidade Estadual Paulista (Unesp) |
dc.contributor.author.fl_str_mv |
Vieira, Lucas Vasconcelos |
dc.subject.por.fl_str_mv |
Teste F Modelos de covariância Robustez Dados correlacionados Erro do tipo I Poder estatístico Critérios de seleção Simulação F test Covariance models Robustness Correlated data Type I error Statistical power Information criteria Simulation |
topic |
Teste F Modelos de covariância Robustez Dados correlacionados Erro do tipo I Poder estatístico Critérios de seleção Simulação F test Covariance models Robustness Correlated data Type I error Statistical power Information criteria Simulation |
description |
Em experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-07-26T13:55:59Z 2021-07-26T13:55:59Z 2021-05-27 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11449/213630 33004064039P3 |
url |
http://hdl.handle.net/11449/213630 |
identifier_str_mv |
33004064039P3 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
publisher.none.fl_str_mv |
Universidade Estadual Paulista (Unesp) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP |
instname_str |
Universidade Estadual Paulista (UNESP) |
instacron_str |
UNESP |
institution |
UNESP |
reponame_str |
Repositório Institucional da UNESP |
collection |
Repositório Institucional da UNESP |
repository.name.fl_str_mv |
Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP) |
repository.mail.fl_str_mv |
|
_version_ |
1808128218145751040 |