Análise de dispersão e resíduos para dados categóricos longitudinais

Salvador, Maria Letícia

Análise de dispersão e resíduos para dados categóricos longitudinais

Detalhes bibliográficos
Autor(a) principal:	Salvador, Maria Letícia
Data de Publicação:	2024
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/
Resumo:	Experimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados.

Metadados do item

id	USP_20b95ac9936a6cc6a4ceb846abd8c101
oai_identifier_str	oai:teses.usp.br:tde-05112024-114248
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Análise de dispersão e resíduos para dados categóricos longitudinaisAnalysis of dispersion and residues for longitudinal categorical dataAnálise de diagnósticosBayesian hierarchical modelDiagnostic analysisMixed generalized logit modelModelo dos logitos generalizados mistosModelo hierárquico BayesianoOverdispersionSuperdispersãoExperimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados.Experiments and observational studies resulting in longitudinal nominal polytomous data are conducted in various fields of knowledge, especially in agricultural and biological sciences. For the analysis of such data, the Mixed Generalized Logit Model is a class of models that can be employed. One characteristic of this model is the assumption that the variance is a known function of the mean, and it is expected that the observed variance is close to the variance assumed by the model. However, when it is greater than that specified by the model, the phenomenon of overdispersion occurs. Additionally, in the case of nominal polytomous data with clustered structure in longitudinal studies, there is a significant gap in the literature, as the available techniques to detect the presence of this phenomenon are more common for individual data, requiring the development of more suitable and specific methods for this situation. Furthermore, within the scope of mixed generalized logit models, besides detecting the presence of the overdispersion phenomenon, it is essential to verify the model assumptions to validate statistical inferences. In this regard, residual analysis plays a fundamental role, as it allows verifying whether the model assumptions are met, thus ensuring the reliability of statistical inference based on it. It is worth noting that, in the longitudinal context, there is also a gap in the literature for residual analysis related to nominal data, indicating a potential area for research. Another relevant fact is the possibility of encountering problems in parameter estimation by the maximum likelihood method, especially when dealing with nominal polytomous data. Considering these potential and relevant problems for the analysis of longitudinal polytomous data, this thesis proposes the development of a dispersion index, residual analysis, as well as the initial proposal of a Bayesian approach. The present work presents the following structure: the first article presents the proposal of extending a multinomial dispersion index for longitudinal data, providing a diagnostic measure of overdispersion, whose performance was evaluated through a simulation study, showing good performance of its application. The second article proposes residual analysis techniques, including quantile residuals and distance metrics, to assess the adequacy of mixed generalized logit models to polytomous data. These techniques allow for a more detailed assessment of the quality of model fit to the data. Finally, the third article explores the Bayesian approach as an alternative to the mixed generalized logit model, offering a more confident interpretation of the results.Biblioteca Digitais de Teses e Dissertações da USPLara, Idemauro Antonio Rodrigues deSalvador, Maria Letícia2024-07-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPReter o conteúdo por motivos de patente, publicação e/ou direitos autoriais.info:eu-repo/semantics/openAccesspor2024-11-06T18:15:02Zoai:teses.usp.br:tde-05112024-114248Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212024-11-06T18:15:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Análise de dispersão e resíduos para dados categóricos longitudinais Analysis of dispersion and residues for longitudinal categorical data
title	Análise de dispersão e resíduos para dados categóricos longitudinais
spellingShingle	Análise de dispersão e resíduos para dados categóricos longitudinais Salvador, Maria Letícia Análise de diagnósticos Bayesian hierarchical model Diagnostic analysis Mixed generalized logit model Modelo dos logitos generalizados mistos Modelo hierárquico Bayesiano Overdispersion Superdispersão
title_short	Análise de dispersão e resíduos para dados categóricos longitudinais
title_full	Análise de dispersão e resíduos para dados categóricos longitudinais
title_fullStr	Análise de dispersão e resíduos para dados categóricos longitudinais
title_full_unstemmed	Análise de dispersão e resíduos para dados categóricos longitudinais
title_sort	Análise de dispersão e resíduos para dados categóricos longitudinais
author	Salvador, Maria Letícia
author_facet	Salvador, Maria Letícia
author_role	author
dc.contributor.none.fl_str_mv	Lara, Idemauro Antonio Rodrigues de
dc.contributor.author.fl_str_mv	Salvador, Maria Letícia
dc.subject.por.fl_str_mv	Análise de diagnósticos Bayesian hierarchical model Diagnostic analysis Mixed generalized logit model Modelo dos logitos generalizados mistos Modelo hierárquico Bayesiano Overdispersion Superdispersão
topic	Análise de diagnósticos Bayesian hierarchical model Diagnostic analysis Mixed generalized logit model Modelo dos logitos generalizados mistos Modelo hierárquico Bayesiano Overdispersion Superdispersão
description	Experimentos e estudos observacionais que resultam em dados politômicos nominais longitudinais são conduzidos em diversas áreas de conhecimento, especialmente em ciências agrárias e biológicas. Para análises desses dados, o modelo dos logitos generalizados mistos é uma classe de modelos que pode ser empregada. Uma das características deste modelo é a pressuposição de que a variância é uma função conhecida da média, e espera-se que a variância observada esteja próxima da variância pressuposta pelo modelo. Contudo, quando ela é maior do que a especificada pelo modelo, ocorre o fenômeno da superdispersão. Ademais, no caso de dados politômicos nominais com estrutura agrupada em estudos longitudinais, há uma lacuna significativa na literatura, pois as técnicas disponíveis para detectar a presença desse fenômeno são mais comuns para dados individuais, havendo a necessidade de desenvolver métodos mais adequados e específicos para essa situação. Ainda, no âmbito dos modelos logitos generalizados mistos, além de detectar a presença do fenômeno da superdispersão, é essencial verificar os pressupostos do modelo para validar as inferências estatísticas. Nesse sentido, a análise de resíduos desempenha um papel fundamental, pois permite verificar se os pressupostos do modelo são atendidos, garantindo assim a confiabilidade da inferência estatística baseada nele. Vale ressaltar que, no contexto longitudinal, também existe uma lacuna na literatura para a análise de resíduos relativos a dados nominais, indicando uma área potencial para pesquisas. Outro fato relevante é a possibilidade de ocorrer problemas na estimação dos parâmetros pelo método de máxima verossimilhança, especialmente ao lidar com dados politômicos nominais. Considerando esses problemas potenciais e relevantes para a análise de dados politômicos longitudinais, esta tese tem como proposta o desenvolvimento de um método para um índice de dispersão, análise de resíduos, bem como uma proposta inicial de uma abordagem Bayesiana. O presente trabalho apresenta a seguinte estrutura: o primeiro artigo traz a proposta da extensão de um índice de dispersão multinomial para dados longitudinais, proporcionando uma medida diagnóstica da superdispersão, cuja performance foi avaliada por meio de um estudo de simulação, que mostrou o bom desempenho de sua aplicação. O segundo artigo propõe técnicas de análise de resíduos, incluindo resíduos quantílicos e métricas de distância, para avaliar a adequação dos modelos logitos generalizados mistos aos dados politômicos. Essas técnicas permitem uma avaliação mais detalhada da qualidade do ajuste do modelo aos dados. Por fim, o terceiro artigo explora a abordagem Bayesiana como uma alternativa ao modelo dos logitos generalizados, proporcionando uma interpretação mais robusta dos resultados.
publishDate	2024
dc.date.none.fl_str_mv	2024-07-12
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/
url	https://www.teses.usp.br/teses/disponiveis/11/11134/tde-05112024-114248/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Reter o conteúdo por motivos de patente, publicação e/ou direitos autoriais. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Reter o conteúdo por motivos de patente, publicação e/ou direitos autoriais.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1826319220607025152

Análise de dispersão e resíduos para dados categóricos longitudinais

Registros relacionados