Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
Autor(a) principal: | |
---|---|
Data de Publicação: | 2001 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/ |
Resumo: | O controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão. |
id |
USP_7086c1e09a183f3496138f23798c290b |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20200111-151502 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempoOverdispersion models for proportions from toxicological bioassays over timeCONTROLE BIOLÓGICOMODELOS MATEMÁTICOSPESTICIDASSUPERDISPERSÃOTOXICOLOGIAO controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão.Biological pest control uses entomopathogenic agents or pathogens (viruses, fungi, bacteria, parasites and nematodes) to control or eliminate a pest population. These biological control methods are an alternative to traditional methods and are becoming of increased interest because of the cancelation of many chemical pesticide registrations, and also because they are ecologically and economically attractive. ln toxicology experiments for these agents, it is common to use a response such as the cumulative mortality in a group (cluster) of insects measured at various time points (days) during the course of the experiment. Hence, the data is partly longitudinal since the cumulative mortality (for the individual clusters) is modeled as a function of time and cluster level covariates. The problem of fitting cumulative mortality as a function of time to clustered data involves modeling the multinomial response over time. An additional aspect here is the possibility of extra-multinomial variation (overdispersion) arising from the use of clusters as the experimental units. A consequence of failing to take overdispersion into account is not only underestimation of the standard errors of estimated regression coefficients but also those of the lethal time LTp - the time until a certain proportion p of insects have died - giving incorrect significance of treatment effects (Hinde and Demétrio, 1998) and confidence intervals that are too short. For this particular type of data, there are only a few appropriate methods and models that can be applied. Standard approaches include survival analysis (Petkau and Sitter, 1989) and ordinal generalized linear models (McCullagh, 1980; Glonek and McCullagh, 1995). However, these approaches are questionable when there is extra-multinomial variability in the data. Whatever the approach taken, it needs to be able to incorporate the possibility of overdispersion arising from the use of clusters as the experimental units. The use of Liang and Zeger's (1986) generalized estimating equations (GEE) as a multivariate version of quasi-likelihood (QL) (McCullagh and Nelder, 1989) has been considered as an approach to the problem of fitting a generalized linear model (GLM) to clustered data. The GEE approach addresses the problem of correlated or overdispersed data by using an adjusted score equation for the parameter estimates. We have to specify only the first two moments of the response vector for each cluster, assuming a form for the functional relationship between the mean and the variance. Here there is no need to specify the entire likelihood, which is of ten intractable for non-Gaussian data, even if additional assumptions are made. For Gaussian data the first and second moments fully identify the likelihood, but with non-Gaussian data it is necessary to make additional assumptions about higher-order moments. In this paper we use the generalized linear model framework for multinomial data to model overdispersion in clustered data following the approach given in O'Hara Hines and Lawless (1993). We use a logit link function and day as an explanatory variable, in all of the models that we present here. The first model we consider is the standard cumulative multinomial model. The second model is an extension to multinomial data of the beta-binomial model, which is often used for overdispersed binomial data. This model compounds the multinomial distribution for the observed counts with a Dirichlet distribution for the vector of underlying probabilities, leading to a Dirichlet-multinomial distribution, which has a different form for the variance function to the standard multinomial distribution. The third model is a random intercept model, where we incorporate an additive random effect in the linear predictor to give a random location shift for each disctinct multinomial sample. The final model is an extension of third model and includes both random intercepts and random slopes.Biblioteca Digitais de Teses e Dissertações da USPDemetrio, Clarice Garcia BorgesFreitas, Silvia Maria de2001-07-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-01-12T03:38:02Zoai:teses.usp.br:tde-20200111-151502Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-01-12T03:38:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo Overdispersion models for proportions from toxicological bioassays over time |
title |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo |
spellingShingle |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo Freitas, Silvia Maria de CONTROLE BIOLÓGICO MODELOS MATEMÁTICOS PESTICIDAS SUPERDISPERSÃO TOXICOLOGIA |
title_short |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo |
title_full |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo |
title_fullStr |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo |
title_full_unstemmed |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo |
title_sort |
Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo |
author |
Freitas, Silvia Maria de |
author_facet |
Freitas, Silvia Maria de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Demetrio, Clarice Garcia Borges |
dc.contributor.author.fl_str_mv |
Freitas, Silvia Maria de |
dc.subject.por.fl_str_mv |
CONTROLE BIOLÓGICO MODELOS MATEMÁTICOS PESTICIDAS SUPERDISPERSÃO TOXICOLOGIA |
topic |
CONTROLE BIOLÓGICO MODELOS MATEMÁTICOS PESTICIDAS SUPERDISPERSÃO TOXICOLOGIA |
description |
O controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão. |
publishDate |
2001 |
dc.date.none.fl_str_mv |
2001-07-03 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/ |
url |
https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257202517082112 |