Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar

Detalhes bibliográficos
Autor(a) principal: Moreira, Jeanete Alves
Data de Publicação: 2001
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-150114/
Resumo: Em muitos trabalhos científicos, o interesse dos pesquisadores está em identificar variáveis ou fatores que influenciem no tempo de ocorrência de um determinado evento, o qual geralmente é conhecido como tempo de falha. Nem sempre, porém, é possível observar o tempo exato de ocorrência da falha, conhecendo-se somente o intervalo em que a mesma ocorreu. Dados deste tipo são conhecidos como agrupados ou de sobrevivência com censura intervalar e apresentam observações empatadas. Quando o número de empates é pequeno, a análise desses dados pode ser feita através do ajuste do modelo de Cox (Cox, 1972) considerando-se aproximações para a verossimilhança parcial. No caso de ocorrerem muitos empates, deve-se considerar o tempo como discreto e modelar a probabilidade de ocorrência do evento num determinado intervalo, dado que ele não ocorreu no intervalo imediatamente anterior. Isto pode ser feito considerando-se a variável resposta como uma variável indicadora de falha, que é binária, e ajustando-se os modelos de Cox para dados agrupados ou o modelo logístico, através dos modelos lineares generalizados com funções de ligação complemento log-log e logit, respectivamente. Após o ajuste dos modelos, existe o interesse em selecionar qual deles melhor se adequa aos dados experimentais. Para isto, algumas técnicas de seleção de modelos estão disponíveis na literatura, como o Critério de Informação de Akaike (Akaike, 1973), os Testes Escores propostos por Colosimo et al. (2000), dentre outras. Este trabalho propõe uma nova metodologia para a seleção entre os modelos de Cox e logístico para dados de sobrevivência com censura intervalar, utilizando o método de reamostragem bootstrap dos resíduos. Isto é feito extraindo-se os resíduos dos ajustes dos modelos propostos e calculando-se a diferença de deviances entre os modelos ajustados. Após isto, as novas observações são recompostas a partir dos resíduos bootstrap e novas diferenças de deviances são calculadas. Um histograma para esses valores é, então, obtido e um nível de significância empírico é proposto comparando-se os valores das diferenças de deviances das amostras bootstrap com a diferença de deviances inicial. Os resíduos utilizados são os resíduos simples, de Pearson e de Pearson padronizados. A aplicação da técnica é realizada através de dois conjuntos de dados de experimentos agronômicos, em que, no primeiro, a variável resposta foi o tempo até a murcha de um cultivar de linho susceptível ao patógeno Fusarium oxysporum e, no segundo, a variável resposta é o tempo até o inseto Podysus nigrispinus atingir a fase adulta. O método bootstrap indicou evidência de que o modelo logístico é o mais adequado para ajustar os dados do experimento com linho. Já no caso do experimento com insetos, o método indicou o modelo de Cox como o mais adequado aos dados e o resíduo de Pearson e Pearson padronizado, em ambos os casos, foram os que forneceram uma maior indicação para a escolha dos modelos em questão.
id USP_4c24cecb08fd6fbf8a29f87c5dc029ca
oai_identifier_str oai:teses.usp.br:tde-20200111-150114
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalarThe utilization of the bootstrap method to choose between the cox and the logistic models for interval-censored dataANÁLISE DE SOBREVIVÊNCIAMELÃOMODELOS MATEMÁTICOSPRODUTIVIDADEREAMOSTRAGEM BOOTSTRAPEm muitos trabalhos científicos, o interesse dos pesquisadores está em identificar variáveis ou fatores que influenciem no tempo de ocorrência de um determinado evento, o qual geralmente é conhecido como tempo de falha. Nem sempre, porém, é possível observar o tempo exato de ocorrência da falha, conhecendo-se somente o intervalo em que a mesma ocorreu. Dados deste tipo são conhecidos como agrupados ou de sobrevivência com censura intervalar e apresentam observações empatadas. Quando o número de empates é pequeno, a análise desses dados pode ser feita através do ajuste do modelo de Cox (Cox, 1972) considerando-se aproximações para a verossimilhança parcial. No caso de ocorrerem muitos empates, deve-se considerar o tempo como discreto e modelar a probabilidade de ocorrência do evento num determinado intervalo, dado que ele não ocorreu no intervalo imediatamente anterior. Isto pode ser feito considerando-se a variável resposta como uma variável indicadora de falha, que é binária, e ajustando-se os modelos de Cox para dados agrupados ou o modelo logístico, através dos modelos lineares generalizados com funções de ligação complemento log-log e logit, respectivamente. Após o ajuste dos modelos, existe o interesse em selecionar qual deles melhor se adequa aos dados experimentais. Para isto, algumas técnicas de seleção de modelos estão disponíveis na literatura, como o Critério de Informação de Akaike (Akaike, 1973), os Testes Escores propostos por Colosimo et al. (2000), dentre outras. Este trabalho propõe uma nova metodologia para a seleção entre os modelos de Cox e logístico para dados de sobrevivência com censura intervalar, utilizando o método de reamostragem bootstrap dos resíduos. Isto é feito extraindo-se os resíduos dos ajustes dos modelos propostos e calculando-se a diferença de deviances entre os modelos ajustados. Após isto, as novas observações são recompostas a partir dos resíduos bootstrap e novas diferenças de deviances são calculadas. Um histograma para esses valores é, então, obtido e um nível de significância empírico é proposto comparando-se os valores das diferenças de deviances das amostras bootstrap com a diferença de deviances inicial. Os resíduos utilizados são os resíduos simples, de Pearson e de Pearson padronizados. A aplicação da técnica é realizada através de dois conjuntos de dados de experimentos agronômicos, em que, no primeiro, a variável resposta foi o tempo até a murcha de um cultivar de linho susceptível ao patógeno Fusarium oxysporum e, no segundo, a variável resposta é o tempo até o inseto Podysus nigrispinus atingir a fase adulta. O método bootstrap indicou evidência de que o modelo logístico é o mais adequado para ajustar os dados do experimento com linho. Já no caso do experimento com insetos, o método indicou o modelo de Cox como o mais adequado aos dados e o resíduo de Pearson e Pearson padronizado, em ambos os casos, foram os que forneceram uma maior indicação para a escolha dos modelos em questão.ln many scientific works, researchers are interested in identifying variables or factors that influence the time of occurrence of certain events, which is generally known as failure time. However, it's not always possible to observe the exact failure time knowing only the interval in which failure occurred. Such data are known as grouped data or interval-censored data and present tied observations. When the number of ties is small, analysis of such data can be made by fitting the Cox Model (Cox, 1972) considering approximations for partial likelihood. ln case there are many ties, the time must be considered as discreet and the probability of occurrence of the event must be modeled in a certain interval, since it did not take place in the immediately preceding interval. This can be done by considering the response variable as a binary variable that indicates failure and by fitting the Cox model for grouped data or the logistic model through generalized linear models with complementary log-log and logit link functions, respectively. After fitting the models, it is necessary to decide which of them is more adequate for the experimental data. To that end, some model selection techniques are available in the literature, such as the Akaike lnformation Criterion (Akaike, 1973) and the Score Tests proposed by Colosimo et al. (2000), among others. This work proposes a new methodology to select between the Cox and logistic models for interval-censored data using the bootstrap method for the residues. This is done by extracting the residues from the fit of the proposed models and by calculating the deviance difference between the fitted models. After that, new observations are recomposed from the bootstrap residues and new deviance differences are calculated. A histogram for such values is then obtained and an empirical significance level is proposed by comparing the differences deviance values in the bootstrap samples with the deviance difference in the initial fit. The residues used are the simple residues, Pearson and standardized Pearson residues. The application of the technique was conducted through two data sets concerning agronomic experiments, in the first of which the response variable was the time until the blight of a flax cultivar susceptible to the pathogen Fusarium oxysporum and, in the second, the response variable was the time until the insect Podysus nigrispinus reached its adult phase. The bootstrap method indicated the evidence that the logistic model is more adequate to fit data for the experiment concerning flax. However, in the experiment concerning insects, the method indicated the Cox model as more adequate for the data, and the Pearson and standardized Pearson residue, in both cases, provided a greater indication for the choice of the considered models.Biblioteca Digitais de Teses e Dissertações da USPCorrente, Jose EduardoMoreira, Jeanete Alves2001-12-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-150114/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-01-12T03:23:02Zoai:teses.usp.br:tde-20200111-150114Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-01-12T03:23:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
The utilization of the bootstrap method to choose between the cox and the logistic models for interval-censored data
title Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
spellingShingle Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
Moreira, Jeanete Alves
ANÁLISE DE SOBREVIVÊNCIA
MELÃO
MODELOS MATEMÁTICOS
PRODUTIVIDADE
REAMOSTRAGEM BOOTSTRAP
title_short Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
title_full Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
title_fullStr Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
title_full_unstemmed Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
title_sort Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
author Moreira, Jeanete Alves
author_facet Moreira, Jeanete Alves
author_role author
dc.contributor.none.fl_str_mv Corrente, Jose Eduardo
dc.contributor.author.fl_str_mv Moreira, Jeanete Alves
dc.subject.por.fl_str_mv ANÁLISE DE SOBREVIVÊNCIA
MELÃO
MODELOS MATEMÁTICOS
PRODUTIVIDADE
REAMOSTRAGEM BOOTSTRAP
topic ANÁLISE DE SOBREVIVÊNCIA
MELÃO
MODELOS MATEMÁTICOS
PRODUTIVIDADE
REAMOSTRAGEM BOOTSTRAP
description Em muitos trabalhos científicos, o interesse dos pesquisadores está em identificar variáveis ou fatores que influenciem no tempo de ocorrência de um determinado evento, o qual geralmente é conhecido como tempo de falha. Nem sempre, porém, é possível observar o tempo exato de ocorrência da falha, conhecendo-se somente o intervalo em que a mesma ocorreu. Dados deste tipo são conhecidos como agrupados ou de sobrevivência com censura intervalar e apresentam observações empatadas. Quando o número de empates é pequeno, a análise desses dados pode ser feita através do ajuste do modelo de Cox (Cox, 1972) considerando-se aproximações para a verossimilhança parcial. No caso de ocorrerem muitos empates, deve-se considerar o tempo como discreto e modelar a probabilidade de ocorrência do evento num determinado intervalo, dado que ele não ocorreu no intervalo imediatamente anterior. Isto pode ser feito considerando-se a variável resposta como uma variável indicadora de falha, que é binária, e ajustando-se os modelos de Cox para dados agrupados ou o modelo logístico, através dos modelos lineares generalizados com funções de ligação complemento log-log e logit, respectivamente. Após o ajuste dos modelos, existe o interesse em selecionar qual deles melhor se adequa aos dados experimentais. Para isto, algumas técnicas de seleção de modelos estão disponíveis na literatura, como o Critério de Informação de Akaike (Akaike, 1973), os Testes Escores propostos por Colosimo et al. (2000), dentre outras. Este trabalho propõe uma nova metodologia para a seleção entre os modelos de Cox e logístico para dados de sobrevivência com censura intervalar, utilizando o método de reamostragem bootstrap dos resíduos. Isto é feito extraindo-se os resíduos dos ajustes dos modelos propostos e calculando-se a diferença de deviances entre os modelos ajustados. Após isto, as novas observações são recompostas a partir dos resíduos bootstrap e novas diferenças de deviances são calculadas. Um histograma para esses valores é, então, obtido e um nível de significância empírico é proposto comparando-se os valores das diferenças de deviances das amostras bootstrap com a diferença de deviances inicial. Os resíduos utilizados são os resíduos simples, de Pearson e de Pearson padronizados. A aplicação da técnica é realizada através de dois conjuntos de dados de experimentos agronômicos, em que, no primeiro, a variável resposta foi o tempo até a murcha de um cultivar de linho susceptível ao patógeno Fusarium oxysporum e, no segundo, a variável resposta é o tempo até o inseto Podysus nigrispinus atingir a fase adulta. O método bootstrap indicou evidência de que o modelo logístico é o mais adequado para ajustar os dados do experimento com linho. Já no caso do experimento com insetos, o método indicou o modelo de Cox como o mais adequado aos dados e o resíduo de Pearson e Pearson padronizado, em ambos os casos, foram os que forneceram uma maior indicação para a escolha dos modelos em questão.
publishDate 2001
dc.date.none.fl_str_mv 2001-12-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-150114/
url https://teses.usp.br/teses/disponiveis/11/11134/tde-20200111-150114/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090921139011584