Análise de dispersão e resíduos para dados categóricos longitudinais

Detalhes bibliográficos
Autor(a) principal: Salvador, Maria Letícia
Data de Publicação: 2024
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/
Resumo: Experimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados.
id USP_20b95ac9936a6cc6a4ceb846abd8c101
oai_identifier_str oai:teses.usp.br:tde-05112024-114248
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Análise de dispersão e resíduos para dados categóricos longitudinaisAnalysis of dispersion and residues for longitudinal categorical dataAnálise de diagnósticosBayesian hierarchical modelDiagnostic analysisMixed generalized logit modelModelo dos logitos generalizados mistosModelo hierárquico BayesianoOverdispersionSuperdispersãoExperimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados.Experiments and observational studies resulting in longitudinal nominal polytomous data are conducted in various fields of knowledge, especially in agricultural and biological sciences. For the analysis of such data, the Mixed Generalized Logit Model is a class of models that can be employed. One characteristic of this model is the assumption that the variance is a known function of the mean, and it is expected that the observed variance is close to the variance assumed by the model. However, when it is greater than that specified by the model, the phenomenon of overdispersion occurs. Additionally, in the case of nominal polytomous data with clustered structure in longitudinal studies, there is a significant gap in the literature, as the available techniques to detect the presence of this phenomenon are more common for individual data, requiring the development of more suitable and specific methods for this situation. Furthermore, within the scope of mixed generalized logit models, besides detecting the presence of the overdispersion phenomenon, it is essential to verify the model assumptions to validate statistical inferences. In this regard, residual analysis plays a fundamental role, as it allows verifying whether the model assumptions are met, thus ensuring the reliability of statistical inference based on it. It is worth noting that, in the longitudinal context, there is also a gap in the literature for residual analysis related to nominal data, indicating a potential area for research. Another relevant fact is the possibility of encountering problems in parameter estimation by the maximum likelihood method, especially when dealing with nominal polytomous data. Considering these potential and relevant problems for the analysis of longitudinal polytomous data, this thesis proposes the development of a dispersion index, residual analysis, as well as the initial proposal of a Bayesian approach. The present work presents the following structure: the first article presents the proposal of extending a multinomial dispersion index for longitudinal data, providing a diagnostic measure of overdispersion, whose performance was evaluated through a simulation study, showing good performance of its application. The second article proposes residual analysis techniques, including quantile residuals and distance metrics, to assess the adequacy of mixed generalized logit models to polytomous data. These techniques allow for a more detailed assessment of the quality of model fit to the data. Finally, the third article explores the Bayesian approach as an alternative to the mixed generalized logit model, offering a more confident interpretation of the results.Biblioteca Digitais de Teses e Dissertações da USPLara, Idemauro Antonio Rodrigues deSalvador, Maria Letícia2024-07-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPReter o conteúdo por motivos de patente, publicação e/ou direitos autoriais.info:eu-repo/semantics/openAccesspor2024-11-06T18:15:02Zoai:teses.usp.br:tde-05112024-114248Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-11-06T18:15:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise de dispersão e resíduos para dados categóricos longitudinais
Analysis of dispersion and residues for longitudinal categorical data
title Análise de dispersão e resíduos para dados categóricos longitudinais
spellingShingle Análise de dispersão e resíduos para dados categóricos longitudinais
Salvador, Maria Letícia
Análise de diagnósticos
Bayesian hierarchical model
Diagnostic analysis
Mixed generalized logit model
Modelo dos logitos generalizados mistos
Modelo hierárquico Bayesiano
Overdispersion
Superdispersão
title_short Análise de dispersão e resíduos para dados categóricos longitudinais
title_full Análise de dispersão e resíduos para dados categóricos longitudinais
title_fullStr Análise de dispersão e resíduos para dados categóricos longitudinais
title_full_unstemmed Análise de dispersão e resíduos para dados categóricos longitudinais
title_sort Análise de dispersão e resíduos para dados categóricos longitudinais
author Salvador, Maria Letícia
author_facet Salvador, Maria Letícia
author_role author
dc.contributor.none.fl_str_mv Lara, Idemauro Antonio Rodrigues de
dc.contributor.author.fl_str_mv Salvador, Maria Letícia
dc.subject.por.fl_str_mv Análise de diagnósticos
Bayesian hierarchical model
Diagnostic analysis
Mixed generalized logit model
Modelo dos logitos generalizados mistos
Modelo hierárquico Bayesiano
Overdispersion
Superdispersão
topic Análise de diagnósticos
Bayesian hierarchical model
Diagnostic analysis
Mixed generalized logit model
Modelo dos logitos generalizados mistos
Modelo hierárquico Bayesiano
Overdispersion
Superdispersão
description Experimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados.
publishDate 2024
dc.date.none.fl_str_mv 2024-07-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/
url https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Reter o conteúdo por motivos de patente, publicação e/ou direitos autoriais.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Reter o conteúdo por motivos de patente, publicação e/ou direitos autoriais.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256489981378560