Análise de dispersão e resíduos para dados categóricos longitudinais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2024 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/ |
Resumo: | Experimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados. |
id |
USP_20b95ac9936a6cc6a4ceb846abd8c101 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-05112024-114248 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Análise de dispersão e resíduos para dados categóricos longitudinaisAnalysis of dispersion and residues for longitudinal categorical dataAnálise de diagnósticosBayesian hierarchical modelDiagnostic analysisMixed generalized logit modelModelo dos logitos generalizados mistosModelo hierárquico BayesianoOverdispersionSuperdispersãoExperimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados.Experiments and observational studies resulting in longitudinal nominal polytomous data are conducted in various fields of knowledge, especially in agricultural and biological sciences. For the analysis of such data, the Mixed Generalized Logit Model is a class of models that can be employed. One characteristic of this model is the assumption that the variance is a known function of the mean, and it is expected that the observed variance is close to the variance assumed by the model. However, when it is greater than that specified by the model, the phenomenon of overdispersion occurs. Additionally, in the case of nominal polytomous data with clustered structure in longitudinal studies, there is a significant gap in the literature, as the available techniques to detect the presence of this phenomenon are more common for individual data, requiring the development of more suitable and specific methods for this situation. Furthermore, within the scope of mixed generalized logit models, besides detecting the presence of the overdispersion phenomenon, it is essential to verify the model assumptions to validate statistical inferences. In this regard, residual analysis plays a fundamental role, as it allows verifying whether the model assumptions are met, thus ensuring the reliability of statistical inference based on it. It is worth noting that, in the longitudinal context, there is also a gap in the literature for residual analysis related to nominal data, indicating a potential area for research. Another relevant fact is the possibility of encountering problems in parameter estimation by the maximum likelihood method, especially when dealing with nominal polytomous data. Considering these potential and relevant problems for the analysis of longitudinal polytomous data, this thesis proposes the development of a dispersion index, residual analysis, as well as the initial proposal of a Bayesian approach. The present work presents the following structure: the first article presents the proposal of extending a multinomial dispersion index for longitudinal data, providing a diagnostic measure of overdispersion, whose performance was evaluated through a simulation study, showing good performance of its application. The second article proposes residual analysis techniques, including quantile residuals and distance metrics, to assess the adequacy of mixed generalized logit models to polytomous data. These techniques allow for a more detailed assessment of the quality of model fit to the data. Finally, the third article explores the Bayesian approach as an alternative to the mixed generalized logit model, offering a more confident interpretation of the results.Biblioteca Digitais de Teses e Dissertações da USPLara, Idemauro Antonio Rodrigues deSalvador, Maria Letícia2024-07-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPReter o conteúdo por motivos de patente, publicação e/ou direitos autoriais.info:eu-repo/semantics/openAccesspor2024-11-06T18:15:02Zoai:teses.usp.br:tde-05112024-114248Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-11-06T18:15:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Análise de dispersão e resíduos para dados categóricos longitudinais Analysis of dispersion and residues for longitudinal categorical data |
title |
Análise de dispersão e resíduos para dados categóricos longitudinais |
spellingShingle |
Análise de dispersão e resíduos para dados categóricos longitudinais Salvador, Maria Letícia Análise de diagnósticos Bayesian hierarchical model Diagnostic analysis Mixed generalized logit model Modelo dos logitos generalizados mistos Modelo hierárquico Bayesiano Overdispersion Superdispersão |
title_short |
Análise de dispersão e resíduos para dados categóricos longitudinais |
title_full |
Análise de dispersão e resíduos para dados categóricos longitudinais |
title_fullStr |
Análise de dispersão e resíduos para dados categóricos longitudinais |
title_full_unstemmed |
Análise de dispersão e resíduos para dados categóricos longitudinais |
title_sort |
Análise de dispersão e resíduos para dados categóricos longitudinais |
author |
Salvador, Maria Letícia |
author_facet |
Salvador, Maria Letícia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lara, Idemauro Antonio Rodrigues de |
dc.contributor.author.fl_str_mv |
Salvador, Maria Letícia |
dc.subject.por.fl_str_mv |
Análise de diagnósticos Bayesian hierarchical model Diagnostic analysis Mixed generalized logit model Modelo dos logitos generalizados mistos Modelo hierárquico Bayesiano Overdispersion Superdispersão |
topic |
Análise de diagnósticos Bayesian hierarchical model Diagnostic analysis Mixed generalized logit model Modelo dos logitos generalizados mistos Modelo hierárquico Bayesiano Overdispersion Superdispersão |
description |
Experimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-07-12 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/ |
url |
https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Reter o conteúdo por motivos de patente, publicação e/ou direitos autoriais. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Reter o conteúdo por motivos de patente, publicação e/ou direitos autoriais. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256489981378560 |