Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo

Detalhes bibliográficos
Autor(a) principal: Freitas, Silvia Maria de
Data de Publicação: 2001
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/
Resumo: O controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão.
id USP_7086c1e09a183f3496138f23798c290b
oai_identifier_str oai:teses.usp.br:tde-20200111-151502
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempoOverdispersion models for proportions from toxicological bioassays over timeCONTROLE BIOLÓGICOMODELOS MATEMÁTICOSPESTICIDASSUPERDISPERSÃOTOXICOLOGIAO controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão.Biological pest control uses entomopathogenic agents or pathogens (viruses, fungi, bacteria, parasites and nematodes) to control or eliminate a pest population. These biological control methods are an alternative to traditional methods and are becoming of increased interest because of the cancelation of many chemical pesticide registrations, and also because they are ecologically and economically attractive. ln toxicology experiments for these agents, it is common to use a response such as the cumulative mortality in a group (cluster) of insects measured at various time points (days) during the course of the experiment. Hence, the data is partly longitudinal since the cumulative mortality (for the individual clusters) is modeled as a function of time and cluster level covariates. The problem of fitting cumulative mortality as a function of time to clustered data involves modeling the multinomial response over time. An additional aspect here is the possibility of extra-multinomial variation (overdispersion) arising from the use of clusters as the experimental units. A consequence of failing to take overdispersion into account is not only underestimation of the standard errors of estimated regression coefficients but also those of the lethal time LTp - the time until a certain proportion p of insects have died - giving incorrect significance of treatment effects (Hinde and Demétrio, 1998) and confidence intervals that are too short. For this particular type of data, there are only a few appropriate methods and models that can be applied. Standard approaches include survival analysis (Petkau and Sitter, 1989) and ordinal generalized linear models (McCullagh, 1980; Glonek and McCullagh, 1995). However, these approaches are questionable when there is extra-multinomial variability in the data. Whatever the approach taken, it needs to be able to incorporate the possibility of overdispersion arising from the use of clusters as the experimental units. The use of Liang and Zeger's (1986) generalized estimating equations (GEE) as a multivariate version of quasi-likelihood (QL) (McCullagh and Nelder, 1989) has been considered as an approach to the problem of fitting a generalized linear model (GLM) to clustered data. The GEE approach addresses the problem of correlated or overdispersed data by using an adjusted score equation for the parameter estimates. We have to specify only the first two moments of the response vector for each cluster, assuming a form for the functional relationship between the mean and the variance. Here there is no need to specify the entire likelihood, which is of ten intractable for non-Gaussian data, even if additional assumptions are made. For Gaussian data the first and second moments fully identify the likelihood, but with non-Gaussian data it is necessary to make additional assumptions about higher-order moments. In this paper we use the generalized linear model framework for multinomial data to model overdispersion in clustered data following the approach given in O'Hara Hines and Lawless (1993). We use a logit link function and day as an explanatory variable, in all of the models that we present here. The first model we consider is the standard cumulative multinomial model. The second model is an extension to multinomial data of the beta-binomial model, which is often used for overdispersed binomial data. This model compounds the multinomial distribution for the observed counts with a Dirichlet distribution for the vector of underlying probabilities, leading to a Dirichlet-multinomial distribution, which has a different form for the variance function to the standard multinomial distribution. The third model is a random intercept model, where we incorporate an additive random effect in the linear predictor to give a random location shift for each disctinct multinomial sample. The final model is an extension of third model and includes both random intercepts and random slopes.Biblioteca Digitais de Teses e Dissertações da USPDemetrio, Clarice Garcia BorgesFreitas, Silvia Maria de2001-07-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-01-12T03:38:02Zoai:teses.usp.br:tde-20200111-151502Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-01-12T03:38:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
Overdispersion models for proportions from toxicological bioassays over time
title Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
spellingShingle Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
Freitas, Silvia Maria de
CONTROLE BIOLÓGICO
MODELOS MATEMÁTICOS
PESTICIDAS
SUPERDISPERSÃO
TOXICOLOGIA
title_short Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_full Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_fullStr Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_full_unstemmed Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_sort Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
author Freitas, Silvia Maria de
author_facet Freitas, Silvia Maria de
author_role author
dc.contributor.none.fl_str_mv Demetrio, Clarice Garcia Borges
dc.contributor.author.fl_str_mv Freitas, Silvia Maria de
dc.subject.por.fl_str_mv CONTROLE BIOLÓGICO
MODELOS MATEMÁTICOS
PESTICIDAS
SUPERDISPERSÃO
TOXICOLOGIA
topic CONTROLE BIOLÓGICO
MODELOS MATEMÁTICOS
PESTICIDAS
SUPERDISPERSÃO
TOXICOLOGIA
description O controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão.
publishDate 2001
dc.date.none.fl_str_mv 2001-07-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/
url https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257202517082112