Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/ |
Resumo: | A obtenção de dados em forma de contagem é muito comum em pesquisas das áreas biológicas e o modelo de regressão Poisson é uma primeira alternativa de análise. No entanto, o modelo de Poisson exige independência, taxa constante de ocorrência e, com isso, variância igual a média. A condição de equidispersão limita seu uso em muitas aplicações, dado que essa relação nem sempre ocorre, podendo a variância ser menor (subdispersão) ou maior (superdispersão) do que a média. Como a ocorrência de dados superdispersos é mais comum do que dados subdispersos, houve um maior avanço em metodologias estatísticas na modelagem de dados com superdispersão. Porém, estudos com subdispersão têm surgido com maior regularidade, indicando que mais atenção é necessária para modelos que melhor expliquem essa estrutura de dados. No primeiro capítulo desta tese são abordados modelos alternativos para o problema da subdispersão, para o qual apresenta-se uma aplicação à ecologia. Como alternativas, foram propostos os modelos double Poisson, COM-Poisson, contagem gama e Poisson generalizada restrita. Essa classe de modelos é mais flexível parase trabalhar a subdispersão assim como a superdispersão (não equidispersão) presente nos dados, devido a presença de um parâmetro adicional. O fenômeno da não equidispersão também é comumente encontrado em dados de contagem longitudinais, isto é, quando a variável resposta em estudo é obtida repetidamente na mesma unidade amostral ao longo do tempo. Neste caso, modelos lineares generalizados mistos com a inclusão de efeitos aleatórios no preditor linear têm sido utilizados para acomodar a não equidispersão. No segundo capítulo é apresentada uma nova abordagem para análise de dados longitudinais com diferentes graus de dispersão, fundamentada na distribuição double Poisson em uma estrutura hierárquica. Para isso, utilizou-se uma variável dummy para particionar a sub- e superdispersão presente nos dados. A motivação deste estudo provém de um estudo clínico da literatura científica, que testa a eficiência de um medicamento na condição clínica de pacientes portadores de epilepsia. A estimação dos parâmetros foi realizada via máxima verossimilhança e o parâmetro de dispersão foi avaliado por meio do teste de razão de verossimilhança. A qualidade do ajuste dos modelos aos dados foi avaliada por meio da análise dos resíduos e, em particular, com o auxílio da técnica exploratória do gráfico meio normal de probabilidade. |
id |
USP_2522995e51250d8455f7600f9954a208 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-06052020-155239 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinaisModels for non-equidispersed counting data with application to ecology and longitudinal studiesHalf-normal plotAquatic macrophytesCorrelated dataDados correlacionadosDistribuição de probabilidadeHalf-normal plotMacrófitas aquáticasMixed modelsModelos mistosProbability distributionProgabideProgabideA obtenção de dados em forma de contagem é muito comum em pesquisas das áreas biológicas e o modelo de regressão Poisson é uma primeira alternativa de análise. No entanto, o modelo de Poisson exige independência, taxa constante de ocorrência e, com isso, variância igual a média. A condição de equidispersão limita seu uso em muitas aplicações, dado que essa relação nem sempre ocorre, podendo a variância ser menor (subdispersão) ou maior (superdispersão) do que a média. Como a ocorrência de dados superdispersos é mais comum do que dados subdispersos, houve um maior avanço em metodologias estatísticas na modelagem de dados com superdispersão. Porém, estudos com subdispersão têm surgido com maior regularidade, indicando que mais atenção é necessária para modelos que melhor expliquem essa estrutura de dados. No primeiro capítulo desta tese são abordados modelos alternativos para o problema da subdispersão, para o qual apresenta-se uma aplicação à ecologia. Como alternativas, foram propostos os modelos double Poisson, COM-Poisson, contagem gama e Poisson generalizada restrita. Essa classe de modelos é mais flexível parase trabalhar a subdispersão assim como a superdispersão (não equidispersão) presente nos dados, devido a presença de um parâmetro adicional. O fenômeno da não equidispersão também é comumente encontrado em dados de contagem longitudinais, isto é, quando a variável resposta em estudo é obtida repetidamente na mesma unidade amostral ao longo do tempo. Neste caso, modelos lineares generalizados mistos com a inclusão de efeitos aleatórios no preditor linear têm sido utilizados para acomodar a não equidispersão. No segundo capítulo é apresentada uma nova abordagem para análise de dados longitudinais com diferentes graus de dispersão, fundamentada na distribuição double Poisson em uma estrutura hierárquica. Para isso, utilizou-se uma variável dummy para particionar a sub- e superdispersão presente nos dados. A motivação deste estudo provém de um estudo clínico da literatura científica, que testa a eficiência de um medicamento na condição clínica de pacientes portadores de epilepsia. A estimação dos parâmetros foi realizada via máxima verossimilhança e o parâmetro de dispersão foi avaliado por meio do teste de razão de verossimilhança. A qualidade do ajuste dos modelos aos dados foi avaliada por meio da análise dos resíduos e, em particular, com o auxílio da técnica exploratória do gráfico meio normal de probabilidade.The use of count data is very common in biological areas research and Poisson regression model is the first alternative method to analyze this type of data. However, the Poisson model requires independence, constant rate of occurrence, and thus, variance equal to media. The equidispersion condition limits its use in many applications, since this relationship does not always occur, where the variance may de smaller (underdispersion) or greater (overdispersion) than the average. Because overdispersion data is more common than undispersed data, there has been a major advance in statistical methodologies in overdispersion data modeling. However, examples of underdispersion studies have emerged more regularly, indicating that more attention is needed for models that better explain this data structure. In the first chapter of this series, alternative models for the underdispersion problem are discussed, for which an application in ecology is presented. Alternatively, double Poisson, COM-Poisson, Gamma count and restricted generalized Poisson models were proposed. This class of models is more flexible to deal with both under- and overdispersion in the data, due to the presence of an additional parameter. The non-equidispersion phenomenon is also commonly found in longitudinal count data, i.e., when a variable under study is repeatedly selected over time. In this case, generalized linear mixed models have been used, where additional normal random effects are included in the linear predictor to account for the non-equidispersion. The second chapter presents a new approach for longitudinal data analysis with different degrees of dispersion, based on double Poisson distribution in a hierarchical structure. For this, a dummy variable was used to partition the under- and overdispersion present in the data. The motivation of this study comes from a clinical study available in the scientific literature, which tested the efficacy of a drug in the clinical condition of patients with epilepsy. Parameter estimation was performed via maximum likelihood and the dispersion parameter was tested by the likelihood ratio test. The quality of the fit of the models was assessed by residual analysis and, in particular, with the help of the exploratory technique of the half-normal plot.Biblioteca Digitais de Teses e Dissertações da USPLara, Idemauro Antonio Rodrigues deBatista, Douglas Toledo2020-03-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-05-07T23:58:01Zoai:teses.usp.br:tde-06052020-155239Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-05-07T23:58:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais Models for non-equidispersed counting data with application to ecology and longitudinal studies |
title |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais |
spellingShingle |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais Batista, Douglas Toledo Half-normal plot Aquatic macrophytes Correlated data Dados correlacionados Distribuição de probabilidade Half-normal plot Macrófitas aquáticas Mixed models Modelos mistos Probability distribution Progabide Progabide |
title_short |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais |
title_full |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais |
title_fullStr |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais |
title_full_unstemmed |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais |
title_sort |
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais |
author |
Batista, Douglas Toledo |
author_facet |
Batista, Douglas Toledo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Lara, Idemauro Antonio Rodrigues de |
dc.contributor.author.fl_str_mv |
Batista, Douglas Toledo |
dc.subject.por.fl_str_mv |
Half-normal plot Aquatic macrophytes Correlated data Dados correlacionados Distribuição de probabilidade Half-normal plot Macrófitas aquáticas Mixed models Modelos mistos Probability distribution Progabide Progabide |
topic |
Half-normal plot Aquatic macrophytes Correlated data Dados correlacionados Distribuição de probabilidade Half-normal plot Macrófitas aquáticas Mixed models Modelos mistos Probability distribution Progabide Progabide |
description |
A obtenção de dados em forma de contagem é muito comum em pesquisas das áreas biológicas e o modelo de regressão Poisson é uma primeira alternativa de análise. No entanto, o modelo de Poisson exige independência, taxa constante de ocorrência e, com isso, variância igual a média. A condição de equidispersão limita seu uso em muitas aplicações, dado que essa relação nem sempre ocorre, podendo a variância ser menor (subdispersão) ou maior (superdispersão) do que a média. Como a ocorrência de dados superdispersos é mais comum do que dados subdispersos, houve um maior avanço em metodologias estatísticas na modelagem de dados com superdispersão. Porém, estudos com subdispersão têm surgido com maior regularidade, indicando que mais atenção é necessária para modelos que melhor expliquem essa estrutura de dados. No primeiro capítulo desta tese são abordados modelos alternativos para o problema da subdispersão, para o qual apresenta-se uma aplicação à ecologia. Como alternativas, foram propostos os modelos double Poisson, COM-Poisson, contagem gama e Poisson generalizada restrita. Essa classe de modelos é mais flexível parase trabalhar a subdispersão assim como a superdispersão (não equidispersão) presente nos dados, devido a presença de um parâmetro adicional. O fenômeno da não equidispersão também é comumente encontrado em dados de contagem longitudinais, isto é, quando a variável resposta em estudo é obtida repetidamente na mesma unidade amostral ao longo do tempo. Neste caso, modelos lineares generalizados mistos com a inclusão de efeitos aleatórios no preditor linear têm sido utilizados para acomodar a não equidispersão. No segundo capítulo é apresentada uma nova abordagem para análise de dados longitudinais com diferentes graus de dispersão, fundamentada na distribuição double Poisson em uma estrutura hierárquica. Para isso, utilizou-se uma variável dummy para particionar a sub- e superdispersão presente nos dados. A motivação deste estudo provém de um estudo clínico da literatura científica, que testa a eficiência de um medicamento na condição clínica de pacientes portadores de epilepsia. A estimação dos parâmetros foi realizada via máxima verossimilhança e o parâmetro de dispersão foi avaliado por meio do teste de razão de verossimilhança. A qualidade do ajuste dos modelos aos dados foi avaliada por meio da análise dos resíduos e, em particular, com o auxílio da técnica exploratória do gráfico meio normal de probabilidade. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-03-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/ |
url |
http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06052020-155239/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090443334385664 |