Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais

Detalhes bibliográficos
Autor(a) principal: Batista, Douglas Toledo
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/
Resumo: A obtenção de dados em forma de contagem é muito comum em pesquisas das áreas biológicas e o modelo de regressão Poisson é uma primeira alternativa de análise. No entanto, o modelo de Poisson exige independência, taxa constante de ocorrência e, com isso, variância igual a média. A condição de equidispersão limita seu uso em muitas aplicações, dado que essa relação nem sempre ocorre, podendo a variância ser menor (subdispersão) ou maior (superdispersão) do que a média. Como a ocorrência de dados superdispersos é mais comum do que dados subdispersos, houve um maior avanço em metodologias estatísticas na modelagem de dados com superdispersão. Porém, estudos com subdispersão têm surgido com maior regularidade, indicando que mais atenção é necessária para modelos que melhor expliquem essa estrutura de dados. No primeiro capítulo desta tese são abordados modelos alternativos para o problema da subdispersão, para o qual apresenta-se uma aplicação à ecologia. Como alternativas, foram propostos os modelos double Poisson, COM-Poisson, contagem gama e Poisson generalizada restrita. Essa classe de modelos é mais flexível parase trabalhar a subdispersão assim como a superdispersão (não equidispersão) presente nos dados, devido a presença de um parâmetro adicional. O fenômeno da não equidispersão também é comumente encontrado em dados de contagem longitudinais, isto é, quando a variável resposta em estudo é obtida repetidamente na mesma unidade amostral ao longo do tempo. Neste caso, modelos lineares generalizados mistos com a inclusão de efeitos aleatórios no preditor linear têm sido utilizados para acomodar a não equidispersão. No segundo capítulo é apresentada uma nova abordagem para análise de dados longitudinais com diferentes graus de dispersão, fundamentada na distribuição double Poisson em uma estrutura hierárquica. Para isso, utilizou-se uma variável dummy para particionar a sub- e superdispersão presente nos dados. A motivação deste estudo provém de um estudo clínico da literatura científica, que testa a eficiência de um medicamento na condição clínica de pacientes portadores de epilepsia. A estimação dos parâmetros foi realizada via máxima verossimilhança e o parâmetro de dispersão foi avaliado por meio do teste de razão de verossimilhança. A qualidade do ajuste dos modelos aos dados foi avaliada por meio da análise dos resíduos e, em particular, com o auxílio da técnica exploratória do gráfico meio normal de probabilidade.
id USP_2522995e51250d8455f7600f9954a208
oai_identifier_str oai:teses.usp.br:tde-06052020-155239
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinaisModels for non-equidispersed counting data with application to ecology and longitudinal studiesHalf-normal plotAquatic macrophytesCorrelated dataDados correlacionadosDistribuição de probabilidadeHalf-normal plotMacrófitas aquáticasMixed modelsModelos mistosProbability distributionProgabideProgabideA obtenção de dados em forma de contagem é muito comum em pesquisas das áreas biológicas e o modelo de regressão Poisson é uma primeira alternativa de análise. No entanto, o modelo de Poisson exige independência, taxa constante de ocorrência e, com isso, variância igual a média. A condição de equidispersão limita seu uso em muitas aplicações, dado que essa relação nem sempre ocorre, podendo a variância ser menor (subdispersão) ou maior (superdispersão) do que a média. Como a ocorrência de dados superdispersos é mais comum do que dados subdispersos, houve um maior avanço em metodologias estatísticas na modelagem de dados com superdispersão. Porém, estudos com subdispersão têm surgido com maior regularidade, indicando que mais atenção é necessária para modelos que melhor expliquem essa estrutura de dados. No primeiro capítulo desta tese são abordados modelos alternativos para o problema da subdispersão, para o qual apresenta-se uma aplicação à ecologia. Como alternativas, foram propostos os modelos double Poisson, COM-Poisson, contagem gama e Poisson generalizada restrita. Essa classe de modelos é mais flexível parase trabalhar a subdispersão assim como a superdispersão (não equidispersão) presente nos dados, devido a presença de um parâmetro adicional. O fenômeno da não equidispersão também é comumente encontrado em dados de contagem longitudinais, isto é, quando a variável resposta em estudo é obtida repetidamente na mesma unidade amostral ao longo do tempo. Neste caso, modelos lineares generalizados mistos com a inclusão de efeitos aleatórios no preditor linear têm sido utilizados para acomodar a não equidispersão. No segundo capítulo é apresentada uma nova abordagem para análise de dados longitudinais com diferentes graus de dispersão, fundamentada na distribuição double Poisson em uma estrutura hierárquica. Para isso, utilizou-se uma variável dummy para particionar a sub- e superdispersão presente nos dados. A motivação deste estudo provém de um estudo clínico da literatura científica, que testa a eficiência de um medicamento na condição clínica de pacientes portadores de epilepsia. A estimação dos parâmetros foi realizada via máxima verossimilhança e o parâmetro de dispersão foi avaliado por meio do teste de razão de verossimilhança. A qualidade do ajuste dos modelos aos dados foi avaliada por meio da análise dos resíduos e, em particular, com o auxílio da técnica exploratória do gráfico meio normal de probabilidade.The use of count data is very common in biological areas research and Poisson regression model is the first alternative method to analyze this type of data. However, the Poisson model requires independence, constant rate of occurrence, and thus, variance equal to media. The equidispersion condition limits its use in many applications, since this relationship does not always occur, where the variance may de smaller (underdispersion) or greater (overdispersion) than the average. Because overdispersion data is more common than undispersed data, there has been a major advance in statistical methodologies in overdispersion data modeling. However, examples of underdispersion studies have emerged more regularly, indicating that more attention is needed for models that better explain this data structure. In the first chapter of this series, alternative models for the underdispersion problem are discussed, for which an application in ecology is presented. Alternatively, double Poisson, COM-Poisson, Gamma count and restricted generalized Poisson models were proposed. This class of models is more flexible to deal with both under- and overdispersion in the data, due to the presence of an additional parameter. The non-equidispersion phenomenon is also commonly found in longitudinal count data, i.e., when a variable under study is repeatedly selected over time. In this case, generalized linear mixed models have been used, where additional normal random effects are included in the linear predictor to account for the non-equidispersion. The second chapter presents a new approach for longitudinal data analysis with different degrees of dispersion, based on double Poisson distribution in a hierarchical structure. For this, a dummy variable was used to partition the under- and overdispersion present in the data. The motivation of this study comes from a clinical study available in the scientific literature, which tested the efficacy of a drug in the clinical condition of patients with epilepsy. Parameter estimation was performed via maximum likelihood and the dispersion parameter was tested by the likelihood ratio test. The quality of the fit of the models was assessed by residual analysis and, in particular, with the help of the exploratory technique of the half-normal plot.Biblioteca Digitais de Teses e Dissertações da USPLara, Idemauro Antonio Rodrigues deBatista, Douglas Toledo2020-03-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-05-07T23:58:01Zoai:teses.usp.br:tde-06052020-155239Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-05-07T23:58:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
Models for non-equidispersed counting data with application to ecology and longitudinal studies
title Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
spellingShingle Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
Batista, Douglas Toledo
Half-normal plot
Aquatic macrophytes
Correlated data
Dados correlacionados
Distribuição de probabilidade
Half-normal plot
Macrófitas aquáticas
Mixed models
Modelos mistos
Probability distribution
Progabide
Progabide
title_short Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
title_full Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
title_fullStr Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
title_full_unstemmed Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
title_sort Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
author Batista, Douglas Toledo
author_facet Batista, Douglas Toledo
author_role author
dc.contributor.none.fl_str_mv Lara, Idemauro Antonio Rodrigues de
dc.contributor.author.fl_str_mv Batista, Douglas Toledo
dc.subject.por.fl_str_mv Half-normal plot
Aquatic macrophytes
Correlated data
Dados correlacionados
Distribuição de probabilidade
Half-normal plot
Macrófitas aquáticas
Mixed models
Modelos mistos
Probability distribution
Progabide
Progabide
topic Half-normal plot
Aquatic macrophytes
Correlated data
Dados correlacionados
Distribuição de probabilidade
Half-normal plot
Macrófitas aquáticas
Mixed models
Modelos mistos
Probability distribution
Progabide
Progabide
description A obtenção de dados em forma de contagem é muito comum em pesquisas das áreas biológicas e o modelo de regressão Poisson é uma primeira alternativa de análise. No entanto, o modelo de Poisson exige independência, taxa constante de ocorrência e, com isso, variância igual a média. A condição de equidispersão limita seu uso em muitas aplicações, dado que essa relação nem sempre ocorre, podendo a variância ser menor (subdispersão) ou maior (superdispersão) do que a média. Como a ocorrência de dados superdispersos é mais comum do que dados subdispersos, houve um maior avanço em metodologias estatísticas na modelagem de dados com superdispersão. Porém, estudos com subdispersão têm surgido com maior regularidade, indicando que mais atenção é necessária para modelos que melhor expliquem essa estrutura de dados. No primeiro capítulo desta tese são abordados modelos alternativos para o problema da subdispersão, para o qual apresenta-se uma aplicação à ecologia. Como alternativas, foram propostos os modelos double Poisson, COM-Poisson, contagem gama e Poisson generalizada restrita. Essa classe de modelos é mais flexível parase trabalhar a subdispersão assim como a superdispersão (não equidispersão) presente nos dados, devido a presença de um parâmetro adicional. O fenômeno da não equidispersão também é comumente encontrado em dados de contagem longitudinais, isto é, quando a variável resposta em estudo é obtida repetidamente na mesma unidade amostral ao longo do tempo. Neste caso, modelos lineares generalizados mistos com a inclusão de efeitos aleatórios no preditor linear têm sido utilizados para acomodar a não equidispersão. No segundo capítulo é apresentada uma nova abordagem para análise de dados longitudinais com diferentes graus de dispersão, fundamentada na distribuição double Poisson em uma estrutura hierárquica. Para isso, utilizou-se uma variável dummy para particionar a sub- e superdispersão presente nos dados. A motivação deste estudo provém de um estudo clínico da literatura científica, que testa a eficiência de um medicamento na condição clínica de pacientes portadores de epilepsia. A estimação dos parâmetros foi realizada via máxima verossimilhança e o parâmetro de dispersão foi avaliado por meio do teste de razão de verossimilhança. A qualidade do ajuste dos modelos aos dados foi avaliada por meio da análise dos resíduos e, em particular, com o auxílio da técnica exploratória do gráfico meio normal de probabilidade.
publishDate 2020
dc.date.none.fl_str_mv 2020-03-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/
url http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090443334385664