Avaliação do lasso e métodos alternativos em modelos de regressão logística
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/104/104131/tde-05042021-105416/ |
Resumo: | A regressão logística sempre foi uma importante ferramenta não só na área de estatística, mas também em diversas outras áreas como econômica, biológica e médica. Em muitas dessas áreas é comum se deparar com problemas de alta dimensionalidade, no qual o número de cováriaveis a serem testadas é maior do que o tamanho amostral. Métodos clássicos de estimação apresentam certos problemas em alta dimensionalidade. Uma das formas de solucionar esse problema é a estimação por métodos de penalização, como o lasso proposto por Tibshirani (1996). Apesar dos muitos trabalhos feitos da aplicação do lasso no modelo de regressão logística, nenhum apresenta um estudo completo de simulação do desempenho de predição do método utilizando alguma medida tradicional de avaliação de performance. Também não há na literatura trabalhos que comparam o desempenho de outras possíveis combinações feitas a partir do lasso, como por exemplo, o lasso para selecionar covariáveis e a estimação via máxima verossimilhança, ou a seleção via stepwise e a estimação via lasso. Neste trabalho é apresentado um extenso estudo de simulação sob diversos cenários criados com o objetivo de estudar e comparar o desempenho do lasso e outras 3 técnicas combinadas no modelo de regressão logística. Também foram estudados e analisados vários exemplos de aplicações em que o modelo logístico pode ser usado. Através dos resultados obtidos tanto pelas simulações quanto pelas aplicações, em relação ao poder preditivo, foi possível constatar que o lasso se sobressaía ou tinha desempenho similar aos outros métodos em todos os cenários apresentados. Em relação à comparação do modelo ajustado com o verdadeiro, nenhum dentre os métodos considerados se destaca em todos os cenários e em relação a todos os aspectos analisados. |
id |
USP_41279156d8322546741b31a13012be4b |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-05042021-105416 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Avaliação do lasso e métodos alternativos em modelos de regressão logísticaLasso evaluation and alternative methods in logistic regression modelsEstimador de máxima verossimilhançaLassoLassoLogistic regressionMaximum likelihood estimatorRegressão logísticaSeleção de variáveisSelection of variablesStepwiseStepwiseA regressão logística sempre foi uma importante ferramenta não só na área de estatística, mas também em diversas outras áreas como econômica, biológica e médica. Em muitas dessas áreas é comum se deparar com problemas de alta dimensionalidade, no qual o número de cováriaveis a serem testadas é maior do que o tamanho amostral. Métodos clássicos de estimação apresentam certos problemas em alta dimensionalidade. Uma das formas de solucionar esse problema é a estimação por métodos de penalização, como o lasso proposto por Tibshirani (1996). Apesar dos muitos trabalhos feitos da aplicação do lasso no modelo de regressão logística, nenhum apresenta um estudo completo de simulação do desempenho de predição do método utilizando alguma medida tradicional de avaliação de performance. Também não há na literatura trabalhos que comparam o desempenho de outras possíveis combinações feitas a partir do lasso, como por exemplo, o lasso para selecionar covariáveis e a estimação via máxima verossimilhança, ou a seleção via stepwise e a estimação via lasso. Neste trabalho é apresentado um extenso estudo de simulação sob diversos cenários criados com o objetivo de estudar e comparar o desempenho do lasso e outras 3 técnicas combinadas no modelo de regressão logística. Também foram estudados e analisados vários exemplos de aplicações em que o modelo logístico pode ser usado. Através dos resultados obtidos tanto pelas simulações quanto pelas aplicações, em relação ao poder preditivo, foi possível constatar que o lasso se sobressaía ou tinha desempenho similar aos outros métodos em todos os cenários apresentados. Em relação à comparação do modelo ajustado com o verdadeiro, nenhum dentre os métodos considerados se destaca em todos os cenários e em relação a todos os aspectos analisados.Logistic regression has always been an important tool not only in the area of statistics, but also in several other areas such as economic, biological and medical. In many of these areas it is common to encounter problems of high dimensionality, in which the number of covariates to be tested is greater than the sample size. Classic estimation methods present certain problems in high dimensionality. One of the ways to solve this problem is the estimation by methods of penalty, as the lasso proposed by Tibshirani (1996). Despite the many works done on the application of lasso in the logistic regression model, none of them presents a complete study of simulation of the methods prediction performance using some traditional measure of performance evaluation. There are also no studies in the literature that compare the performance of other possible combinations made from lasso, such as lasso to select covariates and estimation via maximum likelihood, or selection via stepwise and estimation via lasso. In this work an extensive simulation study is presented under several scenarios created in order to study and compare the performance of the lasso and 3 other techniques combined in the logistic regression model. Several examples of applications in which the logistic model can be used were also studied and analyzed. Through the results obtained both by the simulations and by the applications, in relation to the predictive power, it was possible to verify that the lasso stood out or had similar performance to the other methods in all the presented scenarios. Regarding the comparison of the adjusted model with the real one, none of the methods considered stands out in all scenarios and in relation to all aspects analyzed.Biblioteca Digitais de Teses e Dissertações da USPPereira, Gustavo Henrique de AraujoAlcântara Junior, Gilberto Pereira de2021-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/104/104131/tde-05042021-105416/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2021-04-05T17:01:02Zoai:teses.usp.br:tde-05042021-105416Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-04-05T17:01:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Avaliação do lasso e métodos alternativos em modelos de regressão logística Lasso evaluation and alternative methods in logistic regression models |
title |
Avaliação do lasso e métodos alternativos em modelos de regressão logística |
spellingShingle |
Avaliação do lasso e métodos alternativos em modelos de regressão logística Alcântara Junior, Gilberto Pereira de Estimador de máxima verossimilhança Lasso Lasso Logistic regression Maximum likelihood estimator Regressão logística Seleção de variáveis Selection of variables Stepwise Stepwise |
title_short |
Avaliação do lasso e métodos alternativos em modelos de regressão logística |
title_full |
Avaliação do lasso e métodos alternativos em modelos de regressão logística |
title_fullStr |
Avaliação do lasso e métodos alternativos em modelos de regressão logística |
title_full_unstemmed |
Avaliação do lasso e métodos alternativos em modelos de regressão logística |
title_sort |
Avaliação do lasso e métodos alternativos em modelos de regressão logística |
author |
Alcântara Junior, Gilberto Pereira de |
author_facet |
Alcântara Junior, Gilberto Pereira de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pereira, Gustavo Henrique de Araujo |
dc.contributor.author.fl_str_mv |
Alcântara Junior, Gilberto Pereira de |
dc.subject.por.fl_str_mv |
Estimador de máxima verossimilhança Lasso Lasso Logistic regression Maximum likelihood estimator Regressão logística Seleção de variáveis Selection of variables Stepwise Stepwise |
topic |
Estimador de máxima verossimilhança Lasso Lasso Logistic regression Maximum likelihood estimator Regressão logística Seleção de variáveis Selection of variables Stepwise Stepwise |
description |
A regressão logística sempre foi uma importante ferramenta não só na área de estatística, mas também em diversas outras áreas como econômica, biológica e médica. Em muitas dessas áreas é comum se deparar com problemas de alta dimensionalidade, no qual o número de cováriaveis a serem testadas é maior do que o tamanho amostral. Métodos clássicos de estimação apresentam certos problemas em alta dimensionalidade. Uma das formas de solucionar esse problema é a estimação por métodos de penalização, como o lasso proposto por Tibshirani (1996). Apesar dos muitos trabalhos feitos da aplicação do lasso no modelo de regressão logística, nenhum apresenta um estudo completo de simulação do desempenho de predição do método utilizando alguma medida tradicional de avaliação de performance. Também não há na literatura trabalhos que comparam o desempenho de outras possíveis combinações feitas a partir do lasso, como por exemplo, o lasso para selecionar covariáveis e a estimação via máxima verossimilhança, ou a seleção via stepwise e a estimação via lasso. Neste trabalho é apresentado um extenso estudo de simulação sob diversos cenários criados com o objetivo de estudar e comparar o desempenho do lasso e outras 3 técnicas combinadas no modelo de regressão logística. Também foram estudados e analisados vários exemplos de aplicações em que o modelo logístico pode ser usado. Através dos resultados obtidos tanto pelas simulações quanto pelas aplicações, em relação ao poder preditivo, foi possível constatar que o lasso se sobressaía ou tinha desempenho similar aos outros métodos em todos os cenários apresentados. Em relação à comparação do modelo ajustado com o verdadeiro, nenhum dentre os métodos considerados se destaca em todos os cenários e em relação a todos os aspectos analisados. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-03-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-05042021-105416/ |
url |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-05042021-105416/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256689995153408 |