Combining LASSO-Type methods with a smooth transition random forest

Detalhes bibliográficos
Autor(a) principal: Gandini, Alexandre Luís Debiasi
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/253264
Resumo: Neste trabalho, propomos um novo método híbrido para a estimação de modelos de regressão, baseado em uma combinação de métodos do tipo LASSO e de random forest com transição suave (STR). Modelos de regressão baseados em árvores são conhecidos por sua flexibilidade e capacidade em reconhecer padrões até mesmo altamente não-lineares nos dados. O modelo STR-Tree introduz suavidade nos nós da árvore, levando a uma atribuição não-binária das observações em cada grupo, o que pode ser interpretado como diferentes graus de pertencimento a eles. Nossa proposta consiste em um método em dois passos, da seguinte forma: primeiro ajustamos uma regressão penalizada através do LASSO, então, no segundo passo, utilizamos os resíduos obtidos no primeiro ajuste e estimamos uma random forest com transição suave (STR) dos resíduos novamente contra as covariáveis originais. Procedendo dessa forma, podemos capturar as possíveis importantes relações lineares nos dados, caso presentes, de forma paramétrica no primeiro passo e deixar um modelo muito mais flexível “atacar” as não-linearidades em um segundo momento. Apresentamos estudos numéricos, tanto com dados simulados quanto com dados reais, para ilustrar o desempenho do nosso método. Nossa proposta se mostrou vantajosa em termos de poder preditivo em comparação com outras referências, especialmente se os dados contêm atributos tanto lineares quanto não-lineares.
id URGS_9c15a5ff24b332767431002ce1d9ec05
oai_identifier_str oai:www.lume.ufrgs.br:10183/253264
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Gandini, Alexandre Luís DebiasiZiegelmann, Flavio Augusto2022-12-28T05:06:04Z2022http://hdl.handle.net/10183/253264001158289Neste trabalho, propomos um novo método híbrido para a estimação de modelos de regressão, baseado em uma combinação de métodos do tipo LASSO e de random forest com transição suave (STR). Modelos de regressão baseados em árvores são conhecidos por sua flexibilidade e capacidade em reconhecer padrões até mesmo altamente não-lineares nos dados. O modelo STR-Tree introduz suavidade nos nós da árvore, levando a uma atribuição não-binária das observações em cada grupo, o que pode ser interpretado como diferentes graus de pertencimento a eles. Nossa proposta consiste em um método em dois passos, da seguinte forma: primeiro ajustamos uma regressão penalizada através do LASSO, então, no segundo passo, utilizamos os resíduos obtidos no primeiro ajuste e estimamos uma random forest com transição suave (STR) dos resíduos novamente contra as covariáveis originais. Procedendo dessa forma, podemos capturar as possíveis importantes relações lineares nos dados, caso presentes, de forma paramétrica no primeiro passo e deixar um modelo muito mais flexível “atacar” as não-linearidades em um segundo momento. Apresentamos estudos numéricos, tanto com dados simulados quanto com dados reais, para ilustrar o desempenho do nosso método. Nossa proposta se mostrou vantajosa em termos de poder preditivo em comparação com outras referências, especialmente se os dados contêm atributos tanto lineares quanto não-lineares.In this work, we propose a novel hybrid method for the estimation of regression models, which is based on a combination of LASSO-type methods and smooth transition (STR) random forests. Tree-based regressions are known for their flexibility and skills to learn even very nonlinear patterns. The STR-Tree model introduces smoothness into traditional splitting nodes, leading to a non-binary labeling, which can be interpreted as a group membership degree for each observation. Our proposed approach has two steps, as follows: in the first step we fit a penalized linear regression, via LASSO-type methods, then, in the second step, we take the residuals from the first step fit and estimate a STR random forest for these residuals once more against the original covariates. Therefore, by doing so, we can capture the possibly important linear relationship in the data generating process, if any, via a parametric approach in the first step, and let a highly flexible model “attack” the non-linearities in the second step. We present numerical studies, both with simulated and real data, to illustrate the performance of our method. Our proposal has shown advantages in terms of predictive power in comparisson with other benchmarks, especially if the data possesses both linear and nonlinear features.application/pdfporEstimativa : Estatistica matematicaRegressao estatisticaAleatoriedadeLASSO-type methodsEstimation of regression modelsCombining LASSO-Type methods with a smooth transition random forestinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPrograma de Pós-Graduação em EstatísticaPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001158289.pdf.txt001158289.pdf.txtExtracted Texttext/plain92416http://www.lume.ufrgs.br/bitstream/10183/253264/2/001158289.pdf.txt61fab16144f8a4d8a678befe88ca333dMD52ORIGINAL001158289.pdfTexto completo (inglês)application/pdf729607http://www.lume.ufrgs.br/bitstream/10183/253264/1/001158289.pdff20d61b4079640529c89538fed4f10beMD5110183/2532642023-01-20 06:00:39.657383oai:www.lume.ufrgs.br:10183/253264Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-01-20T08:00:39Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Combining LASSO-Type methods with a smooth transition random forest
title Combining LASSO-Type methods with a smooth transition random forest
spellingShingle Combining LASSO-Type methods with a smooth transition random forest
Gandini, Alexandre Luís Debiasi
Estimativa : Estatistica matematica
Regressao estatistica
Aleatoriedade
LASSO-type methods
Estimation of regression models
title_short Combining LASSO-Type methods with a smooth transition random forest
title_full Combining LASSO-Type methods with a smooth transition random forest
title_fullStr Combining LASSO-Type methods with a smooth transition random forest
title_full_unstemmed Combining LASSO-Type methods with a smooth transition random forest
title_sort Combining LASSO-Type methods with a smooth transition random forest
author Gandini, Alexandre Luís Debiasi
author_facet Gandini, Alexandre Luís Debiasi
author_role author
dc.contributor.author.fl_str_mv Gandini, Alexandre Luís Debiasi
dc.contributor.advisor1.fl_str_mv Ziegelmann, Flavio Augusto
contributor_str_mv Ziegelmann, Flavio Augusto
dc.subject.por.fl_str_mv Estimativa : Estatistica matematica
Regressao estatistica
Aleatoriedade
topic Estimativa : Estatistica matematica
Regressao estatistica
Aleatoriedade
LASSO-type methods
Estimation of regression models
dc.subject.eng.fl_str_mv LASSO-type methods
Estimation of regression models
description Neste trabalho, propomos um novo método híbrido para a estimação de modelos de regressão, baseado em uma combinação de métodos do tipo LASSO e de random forest com transição suave (STR). Modelos de regressão baseados em árvores são conhecidos por sua flexibilidade e capacidade em reconhecer padrões até mesmo altamente não-lineares nos dados. O modelo STR-Tree introduz suavidade nos nós da árvore, levando a uma atribuição não-binária das observações em cada grupo, o que pode ser interpretado como diferentes graus de pertencimento a eles. Nossa proposta consiste em um método em dois passos, da seguinte forma: primeiro ajustamos uma regressão penalizada através do LASSO, então, no segundo passo, utilizamos os resíduos obtidos no primeiro ajuste e estimamos uma random forest com transição suave (STR) dos resíduos novamente contra as covariáveis originais. Procedendo dessa forma, podemos capturar as possíveis importantes relações lineares nos dados, caso presentes, de forma paramétrica no primeiro passo e deixar um modelo muito mais flexível “atacar” as não-linearidades em um segundo momento. Apresentamos estudos numéricos, tanto com dados simulados quanto com dados reais, para ilustrar o desempenho do nosso método. Nossa proposta se mostrou vantajosa em termos de poder preditivo em comparação com outras referências, especialmente se os dados contêm atributos tanto lineares quanto não-lineares.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-12-28T05:06:04Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/253264
dc.identifier.nrb.pt_BR.fl_str_mv 001158289
url http://hdl.handle.net/10183/253264
identifier_str_mv 001158289
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/253264/2/001158289.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/253264/1/001158289.pdf
bitstream.checksum.fl_str_mv 61fab16144f8a4d8a678befe88ca333d
f20d61b4079640529c89538fed4f10be
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085605896355840