Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos

Vieira, Lucas Vasconcelos

Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos

Detalhes bibliográficos
Autor(a) principal:	Vieira, Lucas Vasconcelos
Data de Publicação:	2021
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Repositório Institucional da UNESP
Texto Completo:	http://hdl.handle.net/11449/213630
Resumo:	Em experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.

Metadados do item

id	UNSP_05d5dba0aaf95e782056bb1e088a9bef
oai_identifier_str	oai:repositorio.unesp.br:11449/213630
network_acronym_str	UNSP
network_name_str	Repositório Institucional da UNESP
repository_id_str	2946
spelling	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistosCovariance models for repeated measures: a simulation study on fit, error, and statistical power in linear mixed modelosTeste F Modelos de covariânciaRobustezDados correlacionadosErro do tipo IPoder estatísticoCritérios de seleçãoSimulaçãoF testCovariance modelsRobustnessCorrelated dataType I errorStatistical powerInformation criteriaSimulationEm experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.The premise in experiments with repeated measures is that observations taken in the same experimental unit are correlated and that correlations decrease proportionally to the increase in the distance between measurements in time or space. Nevertheless, these experiments are often analyzed as if the correlations between the repeated measures were constant or using methods that only consider correlations different, which may impact on the rejection rate of the null hypothesis, and ultimately type I error rate and statistical power. In this context, the present study investigated the application of mixed linear models with different assumptions about the covariance matrix in data sets from simulated experiments with repeated measures. 84 scenarios that varied in terms of the covariance matrix pattern (14 structures), number of repeated measurements (4 and 8) and sample size (4, 8 and 12) were evaluated. 10,000 datasets were simulated for each scenario based on a multivariate normal distribution and were subsequently analyzed using mixed linear models. Type I error rate and statistical power for the hypothesis test of the interaction between treatments and repeated measures were estimated as the proportion of p values less than or equal to 0.01 or 0.05 out of a total of 10,000 tests for each scenario. The models were also evaluated for their ability to fit the data using Bayesian Information Criteria (BIC). Thus, the frequency with which the covariance structures were chosen by the selection criteria was computed. Results indicate that the assumption chosen most frequently by the information criteria resulted from the specified covariance structure that corresponded to the empirical covariance structure of the analyzed data sets, particularly for those with larger number of repeated measures and sample sizes. Results also indicate that the use of covariance models that do not recognize heterogeneous correlations between repeated measures can inflate type I error or reduce it to very conservative levels, which may affect the conclusion of agricultural experiments. For a 5% significance level, type I error bias was greater than 2α, while for 1% significance level, bias was over 4α. In addition, the statistical power was reduced when the assumption about the covariance matrix of the data sets did not correspond to the empirical covariance structure, particularly for those datasets with a smaller sample size.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Universidade Estadual Paulista (Unesp)Sartori, Maria Márcia PereiraGodoy, Rodolfo [UNESP]Universidade Estadual Paulista (Unesp)Vieira, Lucas Vasconcelos2021-07-26T13:55:59Z2021-07-26T13:55:59Z2021-05-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/11449/21363033004064039P3porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-10-04T06:04:26Zoai:repositorio.unesp.br:11449/213630Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462023-10-04T06:04:26Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos Covariance models for repeated measures: a simulation study on fit, error, and statistical power in linear mixed modelos
title	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
spellingShingle	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos Vieira, Lucas Vasconcelos Teste F Modelos de covariância Robustez Dados correlacionados Erro do tipo I Poder estatístico Critérios de seleção Simulação F test Covariance models Robustness Correlated data Type I error Statistical power Information criteria Simulation
title_short	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_full	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_fullStr	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_full_unstemmed	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
title_sort	Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos
author	Vieira, Lucas Vasconcelos
author_facet	Vieira, Lucas Vasconcelos
author_role	author
dc.contributor.none.fl_str_mv	Sartori, Maria Márcia Pereira Godoy, Rodolfo [UNESP] Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv	Vieira, Lucas Vasconcelos
dc.subject.por.fl_str_mv	Teste F Modelos de covariância Robustez Dados correlacionados Erro do tipo I Poder estatístico Critérios de seleção Simulação F test Covariance models Robustness Correlated data Type I error Statistical power Information criteria Simulation
topic	Teste F Modelos de covariância Robustez Dados correlacionados Erro do tipo I Poder estatístico Critérios de seleção Simulação F test Covariance models Robustness Correlated data Type I error Statistical power Information criteria Simulation
description	Em experimentos com medidas repetidas, a premissa de simetria composta (esfericidade), isto é, de correlação constante entre observações tomadas na mesma unidade, nem sempre é observada. Não obstante, os dados são frequentemente analisados como se correlações entre as medidas repetidas fossem constantes, como no caso da ANOVA para medidas repetidas, ou utilizando métodos que apenas consideram todas as correlações distintas, como no caso da ANOVA multivariada, podendo impactar na taxa de rejeição da hipótese nula, e consequentemente afetar a taxa de erro do tipo I e o poder estatístico. Nesse contexto, o presente estudo propôs investigar a aplicação de modelos lineares mistos com diferentes pressupostos sobre a matriz de covariância em conjuntos de dados provenientes de experimentos com medidas repetidas simulados. Foram avaliados 84 cenários que variaram quanto o padrão da matriz de covariância (14 estruturas), número de medidas repetidas (4 e 8) e de repetições (4, 8 e 12). Foram simulados 10,000 conjuntos de dados para cada cenário baseado em uma distribuição normal multivariada e que foram posteriormente analisados utilizando modelos lineares mistos aliados a máxima verossimilhança restrita. A taxa de erro do tipo I e o poder estatístico para o teste de hipótese da interação entre tratamentos e medidas repetidas foram estimados como a proporção de valores p menores ou iguais a 0.01 ou 0.05 de um total de 10,000 testes para cada cenário. Os modelos também foram avaliados quanto a habilidade de ajuste aos dados a partir dos critérios de seleção BIC. Assim, a frequência com a qual as estruturas de covariância foram escolhidas pelos critérios de seleção foi computada. Os resultados indicam que o pressuposto escolhido com maior frequência pelos critérios de informação resultou da estrutura de covariância especificada que correspondeu à estrutura de covariância empírica dos conjuntos de dados analisados, particularmente para aqueles conjuntos com tamanho amostral maiores. Os resultados também indicam que o uso de modelos de covariância que não reconheça correlações heterogêneas entre as medidas repetidas pode inflar o erro do tipo I a níveis muito liberais ou reduzi-lo a níveis muito conservadores, podendo afetar a conclusão dos experimentos agrícolas. Para um nível de significância e 0.05, o enviesamento da taxa de erro do tipo I foi superior a 2α, enquanto para um nível de significância de 1%, o enviesamento foi superior a 4α, quando o pressuposto sobre a estrutura de covariância dos dados não considerou a existência de correlações heterogêneas, particularmente para aqueles conjuntos de dados com variâncias também heterogêneas, com um número maior de medidas repetidas e um menor tamanho amostral. A proporção de modelos de covariância escolhidos pelo critério de seleção foi superior para os modelos de covariância que correspondiam a estrutura empírica dos dados, particularmente para aquelas simulações com maior número de medidas repetidas e maior tamanho amostral.
publishDate	2021
dc.date.none.fl_str_mv	2021-07-26T13:55:59Z 2021-07-26T13:55:59Z 2021-05-27
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/11449/213630 33004064039P3
url	http://hdl.handle.net/11449/213630
identifier_str_mv	33004064039P3
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv	Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UNESP instname:Universidade Estadual Paulista (UNESP) instacron:UNESP
instname_str	Universidade Estadual Paulista (UNESP)
instacron_str	UNESP
institution	UNESP
reponame_str	Repositório Institucional da UNESP
collection	Repositório Institucional da UNESP
repository.name.fl_str_mv	Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_	1797789286683115520

Modelos paramétricos de matrizes de covariância para medidas repetidas: um estudo de simulação sobre o ajuste, o erro e o poder estatístico em modelos lineares mistos

Registros relacionados