Statistical learning methods for time series forecasting

Detalhes bibliográficos
Autor(a) principal: Böesch, Klaus
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/220421
Resumo: Métodos para alta dimensão tem ganhado cada vez mais importância na literatura econométrica, onde a inclusão de um grande número de variáveis econômicas e financeiras pode melhorar significativamente o desempenho de previsões de séries temporais. Porém, em um contexto de alta dimensão, métodos tradicionais enfrentam alguns problemas relacionados à interpretabilidade do modelo, variância elevada, correlação espúria, eficiência computacional, entre outros. Métodos de aprendizado estatístico são desenvolvidos para um melhor desempenho de previsão, combinando técnicas de regularização e ajuste empírico dos parâmetros e são capazes de lidar com alguns destes problemas na presença de conjuntos de dados de alta dimensão. No artigo que integra esta dissertação, utilizamos uma variedade de métodos de aprendizado estatístico para previsão de séries temporais, realizando diversos exercícios numéricos, incluindo simulação Monte Carlo e análise empírica de dados. Propusemos um método chamado WLadaENet (weighted lag adaptive Elastic Net), que combina regularização quadrática com penalização ponderada semelhante ao método adaENet, porém, penaliza mais severamente coeficientes de variáveis com defasagens mais elevadas, como o método WLadaLASSO Em nossas simulações, o método WLadaENet apresenta um bom desempenho em termos de seleção de variáveis quando o modelo é esparso e em termos de previsão fora da amostra, mesmo quando o modelo não é esparso e apresenta não linearidades. Em nossa primeira aplicação empírica realizamos previsões entre 1 e 12 meses da inflação do Brasil e do núcleo de inflação, incluindo previsões da inflação acumulada. Na segunda aplicação realizamos previsões para a inflação dos Estados Unidos. O método Ridge apresenta um bom desempenho para as previsões da inflação brasileira e um desempenho moderado para as previsões da inflação norte americana utilizando-se amostras de tamanho semelhante. Porém, quando utilizada uma amostra muito maior para a previsão da inflação norte americana, o desempenho método Ridge reduz drasticamente, enquanto o desempenho do método L2Boost melhora significativamente, principalmente pra a inflação acumulada. O método proposto no artigo, WLadaENet, também apresenta um bom desempenho para previsão da inflação norte americana neste caso.
id URGS_7f0db0000082731bc6280b5aeb02e66c
oai_identifier_str oai:www.lume.ufrgs.br:10183/220421
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Böesch, KlausZiegelmann, Flavio Augusto2021-05-04T04:26:31Z2020http://hdl.handle.net/10183/220421001124761Métodos para alta dimensão tem ganhado cada vez mais importância na literatura econométrica, onde a inclusão de um grande número de variáveis econômicas e financeiras pode melhorar significativamente o desempenho de previsões de séries temporais. Porém, em um contexto de alta dimensão, métodos tradicionais enfrentam alguns problemas relacionados à interpretabilidade do modelo, variância elevada, correlação espúria, eficiência computacional, entre outros. Métodos de aprendizado estatístico são desenvolvidos para um melhor desempenho de previsão, combinando técnicas de regularização e ajuste empírico dos parâmetros e são capazes de lidar com alguns destes problemas na presença de conjuntos de dados de alta dimensão. No artigo que integra esta dissertação, utilizamos uma variedade de métodos de aprendizado estatístico para previsão de séries temporais, realizando diversos exercícios numéricos, incluindo simulação Monte Carlo e análise empírica de dados. Propusemos um método chamado WLadaENet (weighted lag adaptive Elastic Net), que combina regularização quadrática com penalização ponderada semelhante ao método adaENet, porém, penaliza mais severamente coeficientes de variáveis com defasagens mais elevadas, como o método WLadaLASSO Em nossas simulações, o método WLadaENet apresenta um bom desempenho em termos de seleção de variáveis quando o modelo é esparso e em termos de previsão fora da amostra, mesmo quando o modelo não é esparso e apresenta não linearidades. Em nossa primeira aplicação empírica realizamos previsões entre 1 e 12 meses da inflação do Brasil e do núcleo de inflação, incluindo previsões da inflação acumulada. Na segunda aplicação realizamos previsões para a inflação dos Estados Unidos. O método Ridge apresenta um bom desempenho para as previsões da inflação brasileira e um desempenho moderado para as previsões da inflação norte americana utilizando-se amostras de tamanho semelhante. Porém, quando utilizada uma amostra muito maior para a previsão da inflação norte americana, o desempenho método Ridge reduz drasticamente, enquanto o desempenho do método L2Boost melhora significativamente, principalmente pra a inflação acumulada. O método proposto no artigo, WLadaENet, também apresenta um bom desempenho para previsão da inflação norte americana neste caso.High-dimensional methods are getting more and more present in the literature and the inclusion of a large set of economic and financial predictors can improve the time series forecasting performance significantly. However, in high-dimensional context traditional methods face some challenges related to the model‘s interpretability, high variance, spurious correlation, compu- tational efficiency, among others. Statistical learning methods, which are designed to improve out-of-sample prediction by combining regularization and empirical tuning, are able to handle some of these issues in high-dimensional context. In the paper contained into this dissertation we employ a variety of high-dimensional statistical learning methods in order to perform time series forecasting, carrying out a simulation study and presenting two empirical applications. A method we call WLadaENet (weighted lag adaptive Elastic Net) is proposed, which combines quadratic regularization and the adaptive weighted LASSO shrinkage similarly to adaENet, but further penalizes coefficients of higher-lagged variables like WLadaLASSO In our Monte Carlo implementation, the WLadaENet presents a good performance in terms of variable selection when the model is sparse and in terms of forecasting even when the model is not sparse and nonlinearities are included. In the first application we perform forecasts of Brazilian inflation and the core inflation from 1 to 12 months ahead, including the accumulated inflation. In the second application we forecast U.S. inflation. We find that Ridge Regression has a good performance to forecast Brazilian inflation, and a moderate performance to forecast U.S. inflation when the data have (almost) the same size, in turn, when we use a larger sample the performance of Ridge Regression decreases while L2Boost improves its performance, especially when accumulated inflation is considered. The method WLadaENet proposed in the paper also presents a good performance to forecast U.S. inflation in this case.application/pdfporInflaçãoEstatísticaTime seriesStatistical learningMachine learningHigh-dimensional methodsInflation forecastingLASSORandom forestsBoostingStatistical learning methods for time series forecastinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulFaculdade de Ciências EconômicasPrograma de Pós-Graduação em EconomiaPorto Alegre, BR-RS2020mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001124761.pdf.txt001124761.pdf.txtExtracted Texttext/plain149679http://www.lume.ufrgs.br/bitstream/10183/220421/2/001124761.pdf.txtd8b352e00cc89d6d947bffa194959277MD52ORIGINAL001124761.pdfTexto completo (inglês)application/pdf820609http://www.lume.ufrgs.br/bitstream/10183/220421/1/001124761.pdf4083507ce8fb9d61f8f1d2d3b9d31c88MD5110183/2204212021-05-26 04:38:24.481926oai:www.lume.ufrgs.br:10183/220421Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:38:24Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Statistical learning methods for time series forecasting
title Statistical learning methods for time series forecasting
spellingShingle Statistical learning methods for time series forecasting
Böesch, Klaus
Inflação
Estatística
Time series
Statistical learning
Machine learning
High-dimensional methods
Inflation forecasting
LASSO
Random forests
Boosting
title_short Statistical learning methods for time series forecasting
title_full Statistical learning methods for time series forecasting
title_fullStr Statistical learning methods for time series forecasting
title_full_unstemmed Statistical learning methods for time series forecasting
title_sort Statistical learning methods for time series forecasting
author Böesch, Klaus
author_facet Böesch, Klaus
author_role author
dc.contributor.author.fl_str_mv Böesch, Klaus
dc.contributor.advisor1.fl_str_mv Ziegelmann, Flavio Augusto
contributor_str_mv Ziegelmann, Flavio Augusto
dc.subject.por.fl_str_mv Inflação
Estatística
topic Inflação
Estatística
Time series
Statistical learning
Machine learning
High-dimensional methods
Inflation forecasting
LASSO
Random forests
Boosting
dc.subject.eng.fl_str_mv Time series
Statistical learning
Machine learning
High-dimensional methods
Inflation forecasting
LASSO
Random forests
Boosting
description Métodos para alta dimensão tem ganhado cada vez mais importância na literatura econométrica, onde a inclusão de um grande número de variáveis econômicas e financeiras pode melhorar significativamente o desempenho de previsões de séries temporais. Porém, em um contexto de alta dimensão, métodos tradicionais enfrentam alguns problemas relacionados à interpretabilidade do modelo, variância elevada, correlação espúria, eficiência computacional, entre outros. Métodos de aprendizado estatístico são desenvolvidos para um melhor desempenho de previsão, combinando técnicas de regularização e ajuste empírico dos parâmetros e são capazes de lidar com alguns destes problemas na presença de conjuntos de dados de alta dimensão. No artigo que integra esta dissertação, utilizamos uma variedade de métodos de aprendizado estatístico para previsão de séries temporais, realizando diversos exercícios numéricos, incluindo simulação Monte Carlo e análise empírica de dados. Propusemos um método chamado WLadaENet (weighted lag adaptive Elastic Net), que combina regularização quadrática com penalização ponderada semelhante ao método adaENet, porém, penaliza mais severamente coeficientes de variáveis com defasagens mais elevadas, como o método WLadaLASSO Em nossas simulações, o método WLadaENet apresenta um bom desempenho em termos de seleção de variáveis quando o modelo é esparso e em termos de previsão fora da amostra, mesmo quando o modelo não é esparso e apresenta não linearidades. Em nossa primeira aplicação empírica realizamos previsões entre 1 e 12 meses da inflação do Brasil e do núcleo de inflação, incluindo previsões da inflação acumulada. Na segunda aplicação realizamos previsões para a inflação dos Estados Unidos. O método Ridge apresenta um bom desempenho para as previsões da inflação brasileira e um desempenho moderado para as previsões da inflação norte americana utilizando-se amostras de tamanho semelhante. Porém, quando utilizada uma amostra muito maior para a previsão da inflação norte americana, o desempenho método Ridge reduz drasticamente, enquanto o desempenho do método L2Boost melhora significativamente, principalmente pra a inflação acumulada. O método proposto no artigo, WLadaENet, também apresenta um bom desempenho para previsão da inflação norte americana neste caso.
publishDate 2020
dc.date.issued.fl_str_mv 2020
dc.date.accessioned.fl_str_mv 2021-05-04T04:26:31Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/220421
dc.identifier.nrb.pt_BR.fl_str_mv 001124761
url http://hdl.handle.net/10183/220421
identifier_str_mv 001124761
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/220421/2/001124761.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/220421/1/001124761.pdf
bitstream.checksum.fl_str_mv d8b352e00cc89d6d947bffa194959277
4083507ce8fb9d61f8f1d2d3b9d31c88
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085551154397184