Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos

Detalhes bibliográficos
Autor(a) principal: Vieira, Lucas Vasconcelos
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/213630
Resumo: Em experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.
id UNSP_05d5dba0aaf95e782056bb1e088a9bef
oai_identifier_str oai:repositorio.unesp.br:11449/213630
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistosCovariance models for repeated measures: a simulation study on fit, error, and statistical power in linear mixed modelosTeste F Modelos de covariânciaRobustezDados correlacionadosErro do tipo IPoder estatísticoCritérios de seleçãoSimulaçãoF testCovariance modelsRobustnessCorrelated dataType I errorStatistical powerInformation criteriaSimulationEm experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.The premise in experiments with repeated measures is that observations taken in the same experimental unit are correlated and that correlations decrease proportionally to the increase in the distance between measurements in time or space. Nevertheless, these experiments are often analyzed as if the correlations between the repeated measures were constant or using methods that only consider correlations different, which may impact on the rejection rate of the null hypothesis, and ultimately type I error rate and statistical power. In this context, the present study investigated the application of mixed linear models with different assumptions about the covariance matrix in data sets from simulated experiments with repeated measures. 84 scenarios that varied in terms of the covariance matrix pattern (14 structures), number of repeated measurements (4 and 8) and sample size (4, 8 and 12) were evaluated. 10,000 datasets were simulated for each scenario based on a multivariate normal distribution and were subsequently analyzed using mixed linear models. Type I error rate and statistical power for the hypothesis test of the interaction between treatments and repeated measures were estimated as the proportion of p values less than or equal to 0.01 or 0.05 out of a total of 10,000 tests for each scenario. The models were also evaluated for their ability to fit the data using Bayesian Information Criteria (BIC). Thus, the frequency with which the covariance structures were chosen by the selection criteria was computed. Results indicate that the assumption chosen most frequently by the information criteria resulted from the specified covariance structure that corresponded to the empirical covariance structure of the analyzed data sets, particularly for those with larger number of repeated measures and sample sizes. Results also indicate that the use of covariance models that do not recognize heterogeneous correlations between repeated measures can inflate type I error or reduce it to very conservative levels, which may affect the conclusion of agricultural experiments. For a 5% significance level, type I error bias was greater than 2α, while for 1% significance level, bias was over 4α. In addition, the statistical power was reduced when the assumption about the covariance matrix of the data sets did not correspond to the empirical covariance structure, particularly for those datasets with a smaller sample size.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Universidade Estadual Paulista (Unesp)Sartori, Maria Márcia PereiraGodoy, Rodolfo [UNESP]Universidade Estadual Paulista (Unesp)Vieira, Lucas Vasconcelos2021-07-26T13:55:59Z2021-07-26T13:55:59Z2021-05-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/11449/21363033004064039P3porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-10-04T06:04:26Zoai:repositorio.unesp.br:11449/213630Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462023-10-04T06:04:26Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
Covariance models for repeated measures: a simulation study on fit, error, and statistical power in linear mixed modelos
title Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
spellingShingle Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
Vieira, Lucas Vasconcelos
Teste F 
Modelos de covariância
Robustez
Dados correlacionados
Erro do tipo I
Poder estatístico
Critérios de seleção
Simulação
F test
Covariance models
Robustness
Correlated data
Type I error
Statistical power
Information criteria
Simulation
title_short Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_full Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_fullStr Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_full_unstemmed Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_sort Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
author Vieira, Lucas Vasconcelos
author_facet Vieira, Lucas Vasconcelos
author_role author
dc.contributor.none.fl_str_mv Sartori, Maria Márcia Pereira
Godoy, Rodolfo [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Vieira, Lucas Vasconcelos
dc.subject.por.fl_str_mv Teste F 
Modelos de covariância
Robustez
Dados correlacionados
Erro do tipo I
Poder estatístico
Critérios de seleção
Simulação
F test
Covariance models
Robustness
Correlated data
Type I error
Statistical power
Information criteria
Simulation
topic Teste F 
Modelos de covariância
Robustez
Dados correlacionados
Erro do tipo I
Poder estatístico
Critérios de seleção
Simulação
F test
Covariance models
Robustness
Correlated data
Type I error
Statistical power
Information criteria
Simulation
description Em experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.
publishDate 2021
dc.date.none.fl_str_mv 2021-07-26T13:55:59Z
2021-07-26T13:55:59Z
2021-05-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/213630
33004064039P3
url http://hdl.handle.net/11449/213630
identifier_str_mv 33004064039P3
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1797789286683115520