Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas

Detalhes bibliográficos
Autor(a) principal: LEAL, Gustavo dos Santos
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNIFEI (RIUNIFEI)
Texto Completo: https://repositorio.unifei.edu.br/jspui/handle/123456789/3697
Resumo: Realizar previsões acuradas é de suma importância para diversas áreas do conhecimento, como Economia, Gestão, Engenharias, Estatística etc. Existem várias abordagens para se realizar previsões: análise de séries temporais, análise de regressão, redes neurais artificiais etc. Contudo, um cuidado que todo pesquisador ou analista deve ter ao aplicar qualquer uma das referidas técnicas é o cuidado com o overfitting – que ocorre quando um determinado modelo possui tantos parâmetros que se ajusta bem ao conjunto de treino, mas prevê muito mal o conjunto de teste. Recentemente, técnicas de combinação de modelos estão em voga, uma vez que comprovadamente o ensemble de modelos faz com que as métricas de previsão sejam melhores. Entretanto, o problema do overfitting ainda pode estar presente nestes casos. Para contornar este problema, esta tese sugere a aplicação de um passo intermediário entre a seleção de modelos e a otimização dos pesos que é a utilização de um modelo de Análise por Envoltória de Dados adequado à presença de variáveis fracionadas para não ferir o pressuposto de convexidade. Para analisar este método, esta tese aplicará modelos de Box & Jenkins. Criam-se, portanto, Decision Making Units (DMUs) por meio de um Arranjo Fatorial Completo, modificando os parâmetros computacionais. Aplica-se a análise de supereficiência e retem-se as 4 DMUs com maiores índices de eficiência para posterior combinação por meio de otimização de Superfície de Resposta no contexto de Delineamento de Misturas. Propõe-se também a aplicação de técnicas estatística multivariadas para redução de dimensionalidade, a fim de tornar o problema computacionalmente menor. Para validar o método proposto, foi criado um estudo de simulação, comparando os resultados com o método Naive. A simulação mostrou que o método proposto nesta tese apresenta em média melhores resultados. Por fim, o método foi aplicado em séries de demanda de energia elétrica do Brasil e suas cinco regiões.
id UFEI_ac1800ff81ae3c86537cd2377187dc92
oai_identifier_str oai:repositorio.unifei.edu.br:123456789/3697
network_acronym_str UFEI
network_name_str Repositório Institucional da UNIFEI (RIUNIFEI)
repository_id_str 7044
spelling 2023-02-272023-05-192023-05-19T17:05:58Z2023-05-19T17:05:58Zhttps://repositorio.unifei.edu.br/jspui/handle/123456789/3697Realizar previsões acuradas é de suma importância para diversas áreas do conhecimento, como Economia, Gestão, Engenharias, Estatística etc. Existem várias abordagens para se realizar previsões: análise de séries temporais, análise de regressão, redes neurais artificiais etc. Contudo, um cuidado que todo pesquisador ou analista deve ter ao aplicar qualquer uma das referidas técnicas é o cuidado com o overfitting – que ocorre quando um determinado modelo possui tantos parâmetros que se ajusta bem ao conjunto de treino, mas prevê muito mal o conjunto de teste. Recentemente, técnicas de combinação de modelos estão em voga, uma vez que comprovadamente o ensemble de modelos faz com que as métricas de previsão sejam melhores. Entretanto, o problema do overfitting ainda pode estar presente nestes casos. Para contornar este problema, esta tese sugere a aplicação de um passo intermediário entre a seleção de modelos e a otimização dos pesos que é a utilização de um modelo de Análise por Envoltória de Dados adequado à presença de variáveis fracionadas para não ferir o pressuposto de convexidade. Para analisar este método, esta tese aplicará modelos de Box & Jenkins. Criam-se, portanto, Decision Making Units (DMUs) por meio de um Arranjo Fatorial Completo, modificando os parâmetros computacionais. Aplica-se a análise de supereficiência e retem-se as 4 DMUs com maiores índices de eficiência para posterior combinação por meio de otimização de Superfície de Resposta no contexto de Delineamento de Misturas. Propõe-se também a aplicação de técnicas estatística multivariadas para redução de dimensionalidade, a fim de tornar o problema computacionalmente menor. Para validar o método proposto, foi criado um estudo de simulação, comparando os resultados com o método Naive. A simulação mostrou que o método proposto nesta tese apresenta em média melhores resultados. Por fim, o método foi aplicado em séries de demanda de energia elétrica do Brasil e suas cinco regiões.Accurate forecasting is crucial for several areas of knowledge, such as Economics, Management, Engineering and Statistics. There are several approaches to perform forecasting: time series analysis, regression analysis, artificial neural networks, etc. However, both researchers or analysts must be aware when applying any of the aforementioned techniques because of overfitting – which occurs when a given model has so many parameters that it fits well to the training set, but predicts the test set very poorly. Recently, model combination techniques are widely spread, since the ensemble of models is proven to make the forecast metrics better. However, the overfitting problem may still occur in these cases. To overcome this, this thesis suggests the application of an intermediate step between the selection of models for the ensemble and the optimization of their weights, which is the application of a Data Envelopment Analysis model suitable for the presence of fractional variables so as not to harm the assumption of convexity. To analyze this method, this thesis applies Box & Jenkins models. Therefore, Decision Making Units (DMU) are created through a Complete Factorial Arrangement, modifying the computational parameters. Super-efficiency analysis is applied and the 4 DMUs with the highest efficiency indexes are retained for later combination through Response Surface (RSM) optimization in the context of Mixture Design. It is also proposed the application of multivariate statistical techniques for dimensionality reduction, in order to make the problem computationally smaller. To validate the proposed method, a simulation study was created, comparing the results with the Naive method. The simulation showed that the method proposed in this thesis presents, on average, better results. Finally, the method was applied to series about electricity demand from Brazil and its five geographic regions.porUniversidade Federal de ItajubáPrograma de Pós-Graduação: Doutorado - Engenharia de ProduçãoUNIFEIBrasilIEPG - Instituto de Engenharia de Produção e GestãoCNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAOSéries temporaisDelineamento de misturasEnsembleSuperfície de respostaOtimizaçãoAnálise por envoltória de dadosOtimização de modelos SARIMA-DEA com ensembles e delineamento de misturasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisBALESTRASSI, Pedro Paulohttp://lattes.cnpq.br/8999535447828760http://lattes.cnpq.br/4912915319867302LEAL, Gustavo dos SantosLEAL, Gustavo dos Santos. Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas. 2023. 168 f. Tese (Doutorado em Engenharia de Produção) – Universidade Federal de Itajubá, Itajubá, 2023.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFEI (RIUNIFEI)instname:Universidade Federal de Itajubá (UNIFEI)instacron:UNIFEILICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3697/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALTese_2023017.pdfTese_2023017.pdfapplication/pdf3648091https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3697/1/Tese_2023017.pdf31529f0e52b3f8d2cb9558109067525dMD51123456789/36972023-05-19 14:05:58.675oai:repositorio.unifei.edu.br:123456789/3697Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.unifei.edu.br/oai/requestrepositorio@unifei.edu.br || geraldocarlos@unifei.edu.bropendoar:70442023-05-19T17:05:58Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)false
dc.title.pt_BR.fl_str_mv Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
title Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
spellingShingle Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
LEAL, Gustavo dos Santos
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Séries temporais
Delineamento de misturas
Ensemble
Superfície de resposta
Otimização
Análise por envoltória de dados
title_short Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
title_full Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
title_fullStr Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
title_full_unstemmed Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
title_sort Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas
author LEAL, Gustavo dos Santos
author_facet LEAL, Gustavo dos Santos
author_role author
dc.contributor.advisor1.fl_str_mv BALESTRASSI, Pedro Paulo
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8999535447828760
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4912915319867302
dc.contributor.author.fl_str_mv LEAL, Gustavo dos Santos
contributor_str_mv BALESTRASSI, Pedro Paulo
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
topic CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Séries temporais
Delineamento de misturas
Ensemble
Superfície de resposta
Otimização
Análise por envoltória de dados
dc.subject.por.fl_str_mv Séries temporais
Delineamento de misturas
Ensemble
Superfície de resposta
Otimização
Análise por envoltória de dados
description Realizar previsões acuradas é de suma importância para diversas áreas do conhecimento, como Economia, Gestão, Engenharias, Estatística etc. Existem várias abordagens para se realizar previsões: análise de séries temporais, análise de regressão, redes neurais artificiais etc. Contudo, um cuidado que todo pesquisador ou analista deve ter ao aplicar qualquer uma das referidas técnicas é o cuidado com o overfitting – que ocorre quando um determinado modelo possui tantos parâmetros que se ajusta bem ao conjunto de treino, mas prevê muito mal o conjunto de teste. Recentemente, técnicas de combinação de modelos estão em voga, uma vez que comprovadamente o ensemble de modelos faz com que as métricas de previsão sejam melhores. Entretanto, o problema do overfitting ainda pode estar presente nestes casos. Para contornar este problema, esta tese sugere a aplicação de um passo intermediário entre a seleção de modelos e a otimização dos pesos que é a utilização de um modelo de Análise por Envoltória de Dados adequado à presença de variáveis fracionadas para não ferir o pressuposto de convexidade. Para analisar este método, esta tese aplicará modelos de Box & Jenkins. Criam-se, portanto, Decision Making Units (DMUs) por meio de um Arranjo Fatorial Completo, modificando os parâmetros computacionais. Aplica-se a análise de supereficiência e retem-se as 4 DMUs com maiores índices de eficiência para posterior combinação por meio de otimização de Superfície de Resposta no contexto de Delineamento de Misturas. Propõe-se também a aplicação de técnicas estatística multivariadas para redução de dimensionalidade, a fim de tornar o problema computacionalmente menor. Para validar o método proposto, foi criado um estudo de simulação, comparando os resultados com o método Naive. A simulação mostrou que o método proposto nesta tese apresenta em média melhores resultados. Por fim, o método foi aplicado em séries de demanda de energia elétrica do Brasil e suas cinco regiões.
publishDate 2023
dc.date.issued.fl_str_mv 2023-02-27
dc.date.available.fl_str_mv 2023-05-19
2023-05-19T17:05:58Z
dc.date.accessioned.fl_str_mv 2023-05-19T17:05:58Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.unifei.edu.br/jspui/handle/123456789/3697
url https://repositorio.unifei.edu.br/jspui/handle/123456789/3697
dc.language.iso.fl_str_mv por
language por
dc.relation.references.pt_BR.fl_str_mv LEAL, Gustavo dos Santos. Otimização de modelos SARIMA-DEA com ensembles e delineamento de misturas. 2023. 168 f. Tese (Doutorado em Engenharia de Produção) – Universidade Federal de Itajubá, Itajubá, 2023.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.publisher.program.fl_str_mv Programa de Pós-Graduação: Doutorado - Engenharia de Produção
dc.publisher.initials.fl_str_mv UNIFEI
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv IEPG - Instituto de Engenharia de Produção e Gestão
publisher.none.fl_str_mv Universidade Federal de Itajubá
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFEI (RIUNIFEI)
instname:Universidade Federal de Itajubá (UNIFEI)
instacron:UNIFEI
instname_str Universidade Federal de Itajubá (UNIFEI)
instacron_str UNIFEI
institution UNIFEI
reponame_str Repositório Institucional da UNIFEI (RIUNIFEI)
collection Repositório Institucional da UNIFEI (RIUNIFEI)
bitstream.url.fl_str_mv https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3697/2/license.txt
https://repositorio.unifei.edu.br/jspui/bitstream/123456789/3697/1/Tese_2023017.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
31529f0e52b3f8d2cb9558109067525d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFEI (RIUNIFEI) - Universidade Federal de Itajubá (UNIFEI)
repository.mail.fl_str_mv repositorio@unifei.edu.br || geraldocarlos@unifei.edu.br
_version_ 1801863198667702272