Existência de estimadores de máxima verossimilhança em modelos de regressão logística

Denise Pimenta Nacle

Existência de estimadores de máxima verossimilhança em modelos de regressão logística

Detalhes bibliográficos
Autor(a) principal:	Denise Pimenta Nacle
Data de Publicação:	2004
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFMG
Texto Completo:	http://hdl.handle.net/1843/BIRC-BB4PJ6
Resumo:	O modelo de regressão logística é o método estatístico freqüentemente utilizado para tratar respostas binárias, e a estimação dos seus coeficientes é geralmente feita usando o método de máxima verossimilhança. Mas, como tal método baseia-se em propriedades assintóticas dos estimadores, necessitando de amostras geralmente grandes, os resultados obtidos da teoria assintótica podem não ser adequados ou podem não existir, mesmo quando se dispõe de amostras grandes, mas cujos dados são esparsos. Os dados logísticos podem ser classificados em três categorias mutuamente exclusivas e exaustivas, segundo Albert e Anderson (1984): Separação Completa, Separação Quase-Completa e Overlap. Para as duas primeiras categorias, os estimadores de máxima verossimilhança não existem. Este trabalho foi motivado por dois bancos de dados reais que estão classificados na Categoria de Separação Quase-Completa e, portanto, os estimadores de máxima verossimilhança não existem. São apresentadas duas propostas de solução da literatura (regressão logística exata e adição de uma pequena constante aos dados) e, ainda, uma nova solução que consiste simplesmente em retirar, aleatoriamente, uma observação de uma das caselas não-nulas (com mesmo valor da covariável ou mesmo valor da resposta) e adicioná-la à casela nula. Através de Simulações de Monte Carlo, foram comparadas as três propostas de solução quanto ao Erro Quadrático Médio, em que os melhores resultados foram obtidos pela adição de uma pequena constante aos dados e pela eficácia da nova proposta.

Metadados do item

id	UFMG_c88ec1996fa3de44934396a85a9187cb
oai_identifier_str	oai:repositorio.ufmg.br:1843/BIRC-BB4PJ6
network_acronym_str	UFMG
network_name_str	Repositório Institucional da UFMG
repository_id_str
spelling	Enrico Antonio ColosimoBraulio Roberto Gonçalves Marinho CoutoClarice Garcia Borges DemétrioDenise Pimenta Nacle2019-08-12T12:32:23Z2019-08-12T12:32:23Z2004-11-09http://hdl.handle.net/1843/BIRC-BB4PJ6O modelo de regressão logística é o método estatístico freqüentemente utilizado para tratar respostas binárias, e a estimação dos seus coeficientes é geralmente feita usando o método de máxima verossimilhança. Mas, como tal método baseia-se em propriedades assintóticas dos estimadores, necessitando de amostras geralmente grandes, os resultados obtidos da teoria assintótica podem não ser adequados ou podem não existir, mesmo quando se dispõe de amostras grandes, mas cujos dados são esparsos. Os dados logísticos podem ser classificados em três categorias mutuamente exclusivas e exaustivas, segundo Albert e Anderson (1984): Separação Completa, Separação Quase-Completa e Overlap. Para as duas primeiras categorias, os estimadores de máxima verossimilhança não existem. Este trabalho foi motivado por dois bancos de dados reais que estão classificados na Categoria de Separação Quase-Completa e, portanto, os estimadores de máxima verossimilhança não existem. São apresentadas duas propostas de solução da literatura (regressão logística exata e adição de uma pequena constante aos dados) e, ainda, uma nova solução que consiste simplesmente em retirar, aleatoriamente, uma observação de uma das caselas não-nulas (com mesmo valor da covariável ou mesmo valor da resposta) e adicioná-la à casela nula. Através de Simulações de Monte Carlo, foram comparadas as três propostas de solução quanto ao Erro Quadrático Médio, em que os melhores resultados foram obtidos pela adição de uma pequena constante aos dados e pela eficácia da nova proposta.The logistic regression model is the statistical method frequently used to deal with binary responses and the estimation of their coefficients is usually done using the method of maximum likelihood. But as this method is based on the asymptotic properties of the estimators, it needs sample sizes generally large, so the theory asymptotics results cannot be appropriate or cannot exist, even when we have the use of large samples, but their data are sparse. The logistic data can be classified into three mutually exclusive and exhaustive categories, according to Albert and Anderson (1984): complete separation, quasicomplete separation and overlap. For the first two categories, the maximum likelihood estimators do not exist. This researche has been motivated for two real data sets that are classified on the category of separation quasicomplete and, consequently, there are no maximum likelihood estimators. Then, two proposals from the literature (exact logistic regression and addition of a small constant in data) were discussed and it was presented the new proposal, that consists in taking away randomly the results of any of the non-null cell (with same value from covariable or same response value ) and add it to the null cell. The comparison of the proposals is done by using simulations of Monte Carlo. The criterion used for this comparison was the mean-square error. The best results obtained were based on the addition of a small constant in data and the effectiveness of the new proposal.Universidade Federal de Minas GeraisUFMGAnálise de regressãoMétodo de Monte CarloEstatísticaVerossimilhança (Estatística)Análise de regressãoVerossimilhançaMétodo de monte carloExistência de estimadores de máxima verossimilhança em modelos de regressão logísticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdisserta__odenisenacle21122004.pdfapplication/pdf1046366https://repositorio.ufmg.br/bitstream/1843/BIRC-BB4PJ6/1/disserta__odenisenacle21122004.pdf7e59501f2ff860c3d482f0d79cff92c0MD51TEXTdisserta__odenisenacle21122004.pdf.txtdisserta__odenisenacle21122004.pdf.txtExtracted texttext/plain89281https://repositorio.ufmg.br/bitstream/1843/BIRC-BB4PJ6/2/disserta__odenisenacle21122004.pdf.txt73aa3e593d4dc40c47aec39d913bf2b5MD521843/BIRC-BB4PJ62019-11-14 17:50:17.799oai:repositorio.ufmg.br:1843/BIRC-BB4PJ6Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T20:50:17Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv	Existência de estimadores de máxima verossimilhança em modelos de regressão logística
title	Existência de estimadores de máxima verossimilhança em modelos de regressão logística
spellingShingle	Existência de estimadores de máxima verossimilhança em modelos de regressão logística Denise Pimenta Nacle Análise de regressão Verossimilhança Método de monte carlo Análise de regressão Método de Monte Carlo Estatística Verossimilhança (Estatística)
title_short	Existência de estimadores de máxima verossimilhança em modelos de regressão logística
title_full	Existência de estimadores de máxima verossimilhança em modelos de regressão logística
title_fullStr	Existência de estimadores de máxima verossimilhança em modelos de regressão logística
title_full_unstemmed	Existência de estimadores de máxima verossimilhança em modelos de regressão logística
title_sort	Existência de estimadores de máxima verossimilhança em modelos de regressão logística
author	Denise Pimenta Nacle
author_facet	Denise Pimenta Nacle
author_role	author
dc.contributor.advisor1.fl_str_mv	Enrico Antonio Colosimo
dc.contributor.referee1.fl_str_mv	Braulio Roberto Gonçalves Marinho Couto
dc.contributor.referee2.fl_str_mv	Clarice Garcia Borges Demétrio
dc.contributor.author.fl_str_mv	Denise Pimenta Nacle
contributor_str_mv	Enrico Antonio Colosimo Braulio Roberto Gonçalves Marinho Couto Clarice Garcia Borges Demétrio
dc.subject.por.fl_str_mv	Análise de regressão Verossimilhança Método de monte carlo
topic	Análise de regressão Verossimilhança Método de monte carlo Análise de regressão Método de Monte Carlo Estatística Verossimilhança (Estatística)
dc.subject.other.pt_BR.fl_str_mv	Análise de regressão Método de Monte Carlo Estatística Verossimilhança (Estatística)
description	O modelo de regressão logística é o método estatístico freqüentemente utilizado para tratar respostas binárias, e a estimação dos seus coeficientes é geralmente feita usando o método de máxima verossimilhança. Mas, como tal método baseia-se em propriedades assintóticas dos estimadores, necessitando de amostras geralmente grandes, os resultados obtidos da teoria assintótica podem não ser adequados ou podem não existir, mesmo quando se dispõe de amostras grandes, mas cujos dados são esparsos. Os dados logísticos podem ser classificados em três categorias mutuamente exclusivas e exaustivas, segundo Albert e Anderson (1984): Separação Completa, Separação Quase-Completa e Overlap. Para as duas primeiras categorias, os estimadores de máxima verossimilhança não existem. Este trabalho foi motivado por dois bancos de dados reais que estão classificados na Categoria de Separação Quase-Completa e, portanto, os estimadores de máxima verossimilhança não existem. São apresentadas duas propostas de solução da literatura (regressão logística exata e adição de uma pequena constante aos dados) e, ainda, uma nova solução que consiste simplesmente em retirar, aleatoriamente, uma observação de uma das caselas não-nulas (com mesmo valor da covariável ou mesmo valor da resposta) e adicioná-la à casela nula. Através de Simulações de Monte Carlo, foram comparadas as três propostas de solução quanto ao Erro Quadrático Médio, em que os melhores resultados foram obtidos pela adição de uma pequena constante aos dados e pela eficácia da nova proposta.
publishDate	2004
dc.date.issued.fl_str_mv	2004-11-09
dc.date.accessioned.fl_str_mv	2019-08-12T12:32:23Z
dc.date.available.fl_str_mv	2019-08-12T12:32:23Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/1843/BIRC-BB4PJ6
url	http://hdl.handle.net/1843/BIRC-BB4PJ6
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv	UFMG
publisher.none.fl_str_mv	Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG
instname_str	Universidade Federal de Minas Gerais (UFMG)
instacron_str	UFMG
institution	UFMG
reponame_str	Repositório Institucional da UFMG
collection	Repositório Institucional da UFMG
bitstream.url.fl_str_mv	https://repositorio.ufmg.br/bitstream/1843/BIRC-BB4PJ6/1/disserta__odenisenacle21122004.pdf https://repositorio.ufmg.br/bitstream/1843/BIRC-BB4PJ6/2/disserta__odenisenacle21122004.pdf.txt
bitstream.checksum.fl_str_mv	7e59501f2ff860c3d482f0d79cff92c0 73aa3e593d4dc40c47aec39d913bf2b5
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_	1803589512093237248

Existência de estimadores de máxima verossimilhança em modelos de regressão logística

Registros relacionados