Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo

Freitas, Silvia Maria de

Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo

Detalhes bibliográficos
Autor(a) principal:	Freitas, Silvia Maria de
Data de Publicação:	2001
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/
Resumo:	O controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão.

Metadados do item

id	USP_7086c1e09a183f3496138f23798c290b
oai_identifier_str	oai:teses.usp.br:tde-20200111-151502
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempoOverdispersion models for proportions from toxicological bioassays over timeCONTROLE BIOLÓGICOMODELOS MATEMÁTICOSPESTICIDASSUPERDISPERSÃOTOXICOLOGIAO controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão.Biological pest control uses entomopathogenic agents or pathogens (viruses, fungi, bacteria, parasites and nematodes) to control or eliminate a pest population. These biological control methods are an alternative to traditional methods and are becoming of increased interest because of the cancelation of many chemical pesticide registrations, and also because they are ecologically and economically attractive. ln toxicology experiments for these agents, it is common to use a response such as the cumulative mortality in a group (cluster) of insects measured at various time points (days) during the course of the experiment. Hence, the data is partly longitudinal since the cumulative mortality (for the individual clusters) is modeled as a function of time and cluster level covariates. The problem of fitting cumulative mortality as a function of time to clustered data involves modeling the multinomial response over time. An additional aspect here is the possibility of extra-multinomial variation (overdispersion) arising from the use of clusters as the experimental units. A consequence of failing to take overdispersion into account is not only underestimation of the standard errors of estimated regression coefficients but also those of the lethal time LTp - the time until a certain proportion p of insects have died - giving incorrect significance of treatment effects (Hinde and Demétrio, 1998) and confidence intervals that are too short. For this particular type of data, there are only a few appropriate methods and models that can be applied. Standard approaches include survival analysis (Petkau and Sitter, 1989) and ordinal generalized linear models (McCullagh, 1980; Glonek and McCullagh, 1995). However, these approaches are questionable when there is extra-multinomial variability in the data. Whatever the approach taken, it needs to be able to incorporate the possibility of overdispersion arising from the use of clusters as the experimental units. The use of Liang and Zeger's (1986) generalized estimating equations (GEE) as a multivariate version of quasi-likelihood (QL) (McCullagh and Nelder, 1989) has been considered as an approach to the problem of fitting a generalized linear model (GLM) to clustered data. The GEE approach addresses the problem of correlated or overdispersed data by using an adjusted score equation for the parameter estimates. We have to specify only the first two moments of the response vector for each cluster, assuming a form for the functional relationship between the mean and the variance. Here there is no need to specify the entire likelihood, which is of ten intractable for non-Gaussian data, even if additional assumptions are made. For Gaussian data the first and second moments fully identify the likelihood, but with non-Gaussian data it is necessary to make additional assumptions about higher-order moments. In this paper we use the generalized linear model framework for multinomial data to model overdispersion in clustered data following the approach given in O'Hara Hines and Lawless (1993). We use a logit link function and day as an explanatory variable, in all of the models that we present here. The first model we consider is the standard cumulative multinomial model. The second model is an extension to multinomial data of the beta-binomial model, which is often used for overdispersed binomial data. This model compounds the multinomial distribution for the observed counts with a Dirichlet distribution for the vector of underlying probabilities, leading to a Dirichlet-multinomial distribution, which has a different form for the variance function to the standard multinomial distribution. The third model is a random intercept model, where we incorporate an additive random effect in the linear predictor to give a random location shift for each disctinct multinomial sample. The final model is an extension of third model and includes both random intercepts and random slopes.Biblioteca Digitais de Teses e Dissertações da USPDemetrio, Clarice Garcia BorgesFreitas, Silvia Maria de2001-07-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-01-12T03:38:02Zoai:teses.usp.br:tde-20200111-151502Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212020-01-12T03:38:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo Overdispersion models for proportions from toxicological bioassays over time
title	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
spellingShingle	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo Freitas, Silvia Maria de CONTROLE BIOLÓGICO MODELOS MATEMÁTICOS PESTICIDAS SUPERDISPERSÃO TOXICOLOGIA
title_short	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_full	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_fullStr	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_full_unstemmed	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
title_sort	Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo
author	Freitas, Silvia Maria de
author_facet	Freitas, Silvia Maria de
author_role	author
dc.contributor.none.fl_str_mv	Demetrio, Clarice Garcia Borges
dc.contributor.author.fl_str_mv	Freitas, Silvia Maria de
dc.subject.por.fl_str_mv	CONTROLE BIOLÓGICO MODELOS MATEMÁTICOS PESTICIDAS SUPERDISPERSÃO TOXICOLOGIA
topic	CONTROLE BIOLÓGICO MODELOS MATEMÁTICOS PESTICIDAS SUPERDISPERSÃO TOXICOLOGIA
description	O controle biológico de pragas utiliza agentes entomopatogênicos ou patógenos ( vírus, fungos, bactérias, parasitas e nematóides) para controlar ou eliminar uma população de peste. Este método é uma alternativa para métodos tradicionais e está se tornando de interesse crescente em função da proibição do uso de muitos pesticidas químicos, e também porque é ecológica e economicamente atraente. Nos experimentos em toxicologia com esses agentes, é comum o aparecimento de resposta do tipo mortalidade acumulada em um grupo de insetos, medida em vários pontos no tempo (dias, semanas etc). Consequentemente, os dados são em parte longitudinais, desde que a mortalidade acumulada (para cada grupo) é modelada como uma função do tempo e das covariáveis em cada nível do grupo. O problema de ajustar mortalidade acumulada como uma função do tempo para dados agrupados envolve a modelagem de uma resposta multinomial ao longo do tempo. Um aspecto adicional aqui é a possibilidade de uma variação extra-multinomial (superdispersão) que pode surgir em função do uso dos grupos como unidades experimentais. Como consequência por não se considerar a superdispersão tem-se a subestimação dos erros padrões das estimativas dos coeficientes da regressão, levando a conclusões incorretas dos efeitos de tratamentos e intervalos de confiança muito estreitos (Hinde e Demétrio, 1998a, b). Para esse tipo particular de dados, existem poucos métodos e modelos apropriados que podem ser aplicados. Podem ser citados as técnicas de análise de sobrevivência (Petkau & Sitter, 1989) e modelos lineares generalizados ordinais (McCullagh, 1980; Glonek & McCullagh, 1995). Porém, estes procedimentos são questionáveis na presença de variabilidade extra-multinomial nos dados. O uso das equações de estimação generalizadas (EEG) de Liang & Zeger (1986) veio como uma versão multivariada da quase verossimilhança (McCullagh & Nelder, 1989) para o ajuste de modelos lineares generalizados para dados agrupados. Não é necessária a identificação completa do modelo probabilístico, mas apenas a especificação dos dois primeiros momentos do vetor de resposta para cada agrupamento, definindo a relação funcional entre a média e a variância. Não existe necessidade de especificar completamente a verossimilhança, o que muitas vezes é intratável para dados que não tenham distribuição Gaussiana, até mesmo quando são feitas suposições adicionais. Para dados com distribuição Gaussiana os primeiro e segundo momentos identificam completamente a verossimilhança, em caso contrário fazem-se necessárias suposições adicionais sobre momentos de ordem superior a dois. Neste trabalho foi utilizada a metodologia de modelos lineares generalizados para dados multinomiais na modelagem de dados agrupados com superdispersão, seguindo a metodologia proposta por O'Hara Hines & Lawless (1993). Usou-se uma função de ligação logística, considerando o dia como uma variável explicativa, em todos os modelos considerados. O primeiro modelo utilizado foi o modelo multinominal padrão acumulado. O segundo modelo, uma extensão do modelo beta-binomial, utiliza uma distribuição multinominal para a variável resposta e uma distribuição Dirichlet para o vetor de probabilidades, levando a uma distribuição composta Dirichlet-multinomial. O terceiro modelo incorpora um efeito aleatório ao preditor linear produzindo um efeito diferenciado no intercepto da regressão em cada amostra multinominal. O modelo final inclui efeitos aleatórios no intercepto e no coeficiente angular da regressão.
publishDate	2001
dc.date.none.fl_str_mv	2001-07-03
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/
url	https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-151502/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1826318877891493888

Modelos para proporções com superdispersão provenientes de ensaios toxicológicos no tempo

Registros relacionados