Testes estatísticos em regressão logística sob a condição de separabilidade
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | http://locus.ufv.br/handle/123456789/4032 |
Resumo: | Logistic regression is the statistical method of analysis used when the objective is to verify the relationship between one dichotomic response variable and explicative variables of interest. Usually, the model parameters are estimated through the genuine maximum likelihood method, and tests about these parameters are built assuming approximated distributions for the estimators. This means that large samples become necessary to obtain trustable results. In studies involving binary data is common the occurrence of one response variable whose success has low probability, in other words, a rare event that can generate a sparse data sample. In such cases, the data are under separability condition, and this situation is frequently associated to the presence of one categorical co-variable, what means that the maximum likelihood estimators do not exist to one parameter at least. In the separability condition it is recommended to use the Penalized Maximum Likelihood method, proposed by Firth (1993). The main objective of this study was to verify the powers of the Likelihood Ratio Test (LRT) and Wald Test obtained through PML under separability condition by Monte Carlo simulation. The presented methodology has been applied to two real data sets. Monte Carlo simulation with one explicative variable in the model made possible to obtain indicatives that the LRT is most powerful than the Wald test. |
id |
UFV_678dde16141b21ba9a60b8f80312597d |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/4032 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Souza, André Oliveirahttp://lattes.cnpq.br/5802669165872867Colosimo, Enrico Antôniohttp://lattes.cnpq.br/8074052644801438Silva, Fabyano Fonseca ehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2Martins Filho, Sebastiãohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5Loschi, Rosângela Helenahttp://lattes.cnpq.br/8443300958745785Ribeiro Junior, José Ivohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y62015-03-26T13:32:09Z2011-02-242015-03-26T13:32:09Z2010-02-25SOUZA, André Oliveira. Statistical tests in logistic regression under separability condition. 2010. 77 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2010.http://locus.ufv.br/handle/123456789/4032Logistic regression is the statistical method of analysis used when the objective is to verify the relationship between one dichotomic response variable and explicative variables of interest. Usually, the model parameters are estimated through the genuine maximum likelihood method, and tests about these parameters are built assuming approximated distributions for the estimators. This means that large samples become necessary to obtain trustable results. In studies involving binary data is common the occurrence of one response variable whose success has low probability, in other words, a rare event that can generate a sparse data sample. In such cases, the data are under separability condition, and this situation is frequently associated to the presence of one categorical co-variable, what means that the maximum likelihood estimators do not exist to one parameter at least. In the separability condition it is recommended to use the Penalized Maximum Likelihood method, proposed by Firth (1993). The main objective of this study was to verify the powers of the Likelihood Ratio Test (LRT) and Wald Test obtained through PML under separability condition by Monte Carlo simulation. The presented methodology has been applied to two real data sets. Monte Carlo simulation with one explicative variable in the model made possible to obtain indicatives that the LRT is most powerful than the Wald test.A regressão logística é o método estatístico usual de análise utilizado quando o objetivo é verificar a relação entre uma variável resposta dicotômica e variáveis explicativas de interesse. Usualmente, os parâmetros deste modelo são estimados pelo método de máxima verossimilhança genuína, e testes sobre estes parâmetros são construídos considerando as distribuições aproximadas dos estimadores. Isto significa que amostras grandes tornam-se necessárias para obter resultados mais confiáveis. Em estudos envolvendo dados binários, é frequente a presença de uma variável resposta cujo sucesso é pouco provável, ou seja, tem-se um evento raro, o que pode gerar uma amostra de dados esparsos. Nestes casos, diz-se que os dados podem estar sob a condição de separabilidade, e esta situação está frequentemente associada à presença de uma covariável categórica, podendo os estimadores de máxima verossimilhança, para pelo menos um parâmetro, não existir. Na situação de separabilidade recomenda-se utilizar o método de máxima verossimilhança penalizada proposto por Firth (1993). O objetivo principal deste trabalho foi verificar por meio de simulação Monte Carlo os poderes dos testes da razão de verossimilhanças (TRV) e de Wald obtido via máxima verossimilhança penalizada na condição de separabilidade. A metodologia apresentada neste trabalho foi aplicada a dois conjuntos de dados reais. A simulação Monte Carlo com uma variável explicativa no modelo possibilitou obter indicativos que o TRV tem maior poder que o teste de Wald.application/pdfporUniversidade Federal de ViçosaMestrado em Estatística Aplicada e BiometriaUFVBREstatística Aplicada e BiometriaMáxima Verossimilhança PenalizadaSimulaçãoTeste da Razão de VerossimilhançaTeste de WaldPenalizmmed Maximum LikelihoodSimulationLikelihood Ratio TestWald testCNPQ::CIENCIAS AGRARIASTestes estatísticos em regressão logística sob a condição de separabilidadeStatistical tests in logistic regression under separability conditioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdfapplication/pdf1038031https://locus.ufv.br//bitstream/123456789/4032/1/texto%20completo.pdf240d96ef94e9240b2d1dabb639823f07MD51TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain122684https://locus.ufv.br//bitstream/123456789/4032/2/texto%20completo.pdf.txt8c8c0653f59eb38671f243001b4b4944MD52THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3576https://locus.ufv.br//bitstream/123456789/4032/3/texto%20completo.pdf.jpgb078e9d3d43c080bd8b1d02f852c4f0aMD53123456789/40322016-04-09 23:17:27.653oai:locus.ufv.br:123456789/4032Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-10T02:17:27LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.por.fl_str_mv |
Testes estatísticos em regressão logística sob a condição de separabilidade |
dc.title.alternative.eng.fl_str_mv |
Statistical tests in logistic regression under separability condition |
title |
Testes estatísticos em regressão logística sob a condição de separabilidade |
spellingShingle |
Testes estatísticos em regressão logística sob a condição de separabilidade Souza, André Oliveira Máxima Verossimilhança Penalizada Simulação Teste da Razão de Verossimilhança Teste de Wald Penalizmmed Maximum Likelihood Simulation Likelihood Ratio Test Wald test CNPQ::CIENCIAS AGRARIAS |
title_short |
Testes estatísticos em regressão logística sob a condição de separabilidade |
title_full |
Testes estatísticos em regressão logística sob a condição de separabilidade |
title_fullStr |
Testes estatísticos em regressão logística sob a condição de separabilidade |
title_full_unstemmed |
Testes estatísticos em regressão logística sob a condição de separabilidade |
title_sort |
Testes estatísticos em regressão logística sob a condição de separabilidade |
author |
Souza, André Oliveira |
author_facet |
Souza, André Oliveira |
author_role |
author |
dc.contributor.authorLattes.por.fl_str_mv |
http://lattes.cnpq.br/5802669165872867 |
dc.contributor.author.fl_str_mv |
Souza, André Oliveira |
dc.contributor.advisor-co1.fl_str_mv |
Colosimo, Enrico Antônio |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/8074052644801438 |
dc.contributor.advisor-co2.fl_str_mv |
Silva, Fabyano Fonseca e |
dc.contributor.advisor-co2Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2 |
dc.contributor.advisor1.fl_str_mv |
Martins Filho, Sebastião |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5 |
dc.contributor.referee1.fl_str_mv |
Loschi, Rosângela Helena |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/8443300958745785 |
dc.contributor.referee2.fl_str_mv |
Ribeiro Junior, José Ivo |
dc.contributor.referee2Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6 |
contributor_str_mv |
Colosimo, Enrico Antônio Silva, Fabyano Fonseca e Martins Filho, Sebastião Loschi, Rosângela Helena Ribeiro Junior, José Ivo |
dc.subject.por.fl_str_mv |
Máxima Verossimilhança Penalizada Simulação Teste da Razão de Verossimilhança Teste de Wald |
topic |
Máxima Verossimilhança Penalizada Simulação Teste da Razão de Verossimilhança Teste de Wald Penalizmmed Maximum Likelihood Simulation Likelihood Ratio Test Wald test CNPQ::CIENCIAS AGRARIAS |
dc.subject.eng.fl_str_mv |
Penalizmmed Maximum Likelihood Simulation Likelihood Ratio Test Wald test |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS AGRARIAS |
description |
Logistic regression is the statistical method of analysis used when the objective is to verify the relationship between one dichotomic response variable and explicative variables of interest. Usually, the model parameters are estimated through the genuine maximum likelihood method, and tests about these parameters are built assuming approximated distributions for the estimators. This means that large samples become necessary to obtain trustable results. In studies involving binary data is common the occurrence of one response variable whose success has low probability, in other words, a rare event that can generate a sparse data sample. In such cases, the data are under separability condition, and this situation is frequently associated to the presence of one categorical co-variable, what means that the maximum likelihood estimators do not exist to one parameter at least. In the separability condition it is recommended to use the Penalized Maximum Likelihood method, proposed by Firth (1993). The main objective of this study was to verify the powers of the Likelihood Ratio Test (LRT) and Wald Test obtained through PML under separability condition by Monte Carlo simulation. The presented methodology has been applied to two real data sets. Monte Carlo simulation with one explicative variable in the model made possible to obtain indicatives that the LRT is most powerful than the Wald test. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010-02-25 |
dc.date.available.fl_str_mv |
2011-02-24 2015-03-26T13:32:09Z |
dc.date.accessioned.fl_str_mv |
2015-03-26T13:32:09Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SOUZA, André Oliveira. Statistical tests in logistic regression under separability condition. 2010. 77 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2010. |
dc.identifier.uri.fl_str_mv |
http://locus.ufv.br/handle/123456789/4032 |
identifier_str_mv |
SOUZA, André Oliveira. Statistical tests in logistic regression under separability condition. 2010. 77 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2010. |
url |
http://locus.ufv.br/handle/123456789/4032 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Mestrado em Estatística Aplicada e Biometria |
dc.publisher.initials.fl_str_mv |
UFV |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Estatística Aplicada e Biometria |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/4032/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/4032/2/texto%20completo.pdf.txt https://locus.ufv.br//bitstream/123456789/4032/3/texto%20completo.pdf.jpg |
bitstream.checksum.fl_str_mv |
240d96ef94e9240b2d1dabb639823f07 8c8c0653f59eb38671f243001b4b4944 b078e9d3d43c080bd8b1d02f852c4f0a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801213014494412800 |