Análise e modelação do mercado de ações

Detalhes bibliográficos
Autor(a) principal: Gomes, Mário Roberto dos Reis
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.22/22221
Resumo: A presente dissertação, realizada no âmbito do Mestrado em Engenharia e Gestão Industrial (MEGI), é o resultado de um projeto individual, com o objetivo de prever o mercado de ações para uma base temporal de curto prazo, utilizando para isso modelos de machine learning. Foram consideradas para este estudo, apenas ações presentes no SP500 de 2013 a 2018 sensivelmente. Embora a previsão do mercado de ações seja um desafio que tem constantemente motivado a comunidade científica a procurar respostas desde a sua existência, apenas nos últimos anos com a elevada capacidade computacional existente, é que se tem verificado a existência de alguns modelos capazes de prever o mercado de ações de forma lucrativa (Rouf et al., 2021). De realçar que mesmo estes casos de sucesso ainda mostram bastantes fragilidades ao nível da consistência (Rouf et al., 2021). O que se pretende com este projeto é analisar um conjunto de dados macroeconómicos no sentido de concluir se os fatores presentes permitem alcançar melhores resultados de previsão que um modelo de persistência, que considera como valor de previsão, o preço de fecho do dia anterior. Para a realização deste projeto seguiu-se a metodologia CRISP-DM, muito utilizada em projetos de data mining. Através desta metodologia foi possível definir objetivos claros de trabalho, descrever e analisar o dataset utilizado, preparar os dados tendo em conta os modelos utilizados, submeter o dataset aos três modelos utilizados, nomeadamente o Linear Regression, o Random Forest Regression e o MultiLayer Perceptron, e por fim, tecer as devidas conclusões face aos resultados obtidos. Na fase da aplicação dos modelos também se teve em consideração a realização de análises de sensibilidade face aos valores de parâmetros a utilizar, tendo como função objetivo a minimização do erro Root Mean Squared Error. Também foi estudado qual das bases temporais permitia obter os melhores resultados na previsão do valor das ações, nomeadamente considerando apenas os dados do dia anterior ou os dados dos três dias anteriores à previsão. Para efeitos de comparação e análise dos resultados obtidos foi construído um modelo de persistência para o qual são consideradas para o valor de previsão, o valor da ação no dia anterior. Desta forma, consegue-se concluir quais os modelos que apresentam melhores resultados quando se verifica que o Root Mean Squared Error dos modelos é menor que o Root Mean Squared Error do seu modelo de persistência. Por fim tecem-se as conclusões relativamente aos resultados obtidos. De facto, foram encontrados modelos capazes de prever o índice SP500 ou mesmo ações de empresas presentes no índice SP500, mas porque os resultados não se estendem a todas as ações analisadas, essa hipótese não pode ser totalmente corroborada, ainda que dos 8 ativos estudados, 87,5% obteve-se um modelo capaz de prever o preço de ativo melhor que o modelo de persistência. Relativamente às diferenças entre o melhor modelo de cada ativo e o modelo de persistência é possível aferir que as ações com menor volatilidade apresentam diferenças menos significativas.
id RCAP_e067b8d7fa6808118d676edae22ff943
oai_identifier_str oai:recipp.ipp.pt:10400.22/22221
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Análise e modelação do mercado de açõesStock market analysis and modellingData miningMachine learningKNIMEMercado de açõesÍndice SP500Stock marketSP500 indexA presente dissertação, realizada no âmbito do Mestrado em Engenharia e Gestão Industrial (MEGI), é o resultado de um projeto individual, com o objetivo de prever o mercado de ações para uma base temporal de curto prazo, utilizando para isso modelos de machine learning. Foram consideradas para este estudo, apenas ações presentes no SP500 de 2013 a 2018 sensivelmente. Embora a previsão do mercado de ações seja um desafio que tem constantemente motivado a comunidade científica a procurar respostas desde a sua existência, apenas nos últimos anos com a elevada capacidade computacional existente, é que se tem verificado a existência de alguns modelos capazes de prever o mercado de ações de forma lucrativa (Rouf et al., 2021). De realçar que mesmo estes casos de sucesso ainda mostram bastantes fragilidades ao nível da consistência (Rouf et al., 2021). O que se pretende com este projeto é analisar um conjunto de dados macroeconómicos no sentido de concluir se os fatores presentes permitem alcançar melhores resultados de previsão que um modelo de persistência, que considera como valor de previsão, o preço de fecho do dia anterior. Para a realização deste projeto seguiu-se a metodologia CRISP-DM, muito utilizada em projetos de data mining. Através desta metodologia foi possível definir objetivos claros de trabalho, descrever e analisar o dataset utilizado, preparar os dados tendo em conta os modelos utilizados, submeter o dataset aos três modelos utilizados, nomeadamente o Linear Regression, o Random Forest Regression e o MultiLayer Perceptron, e por fim, tecer as devidas conclusões face aos resultados obtidos. Na fase da aplicação dos modelos também se teve em consideração a realização de análises de sensibilidade face aos valores de parâmetros a utilizar, tendo como função objetivo a minimização do erro Root Mean Squared Error. Também foi estudado qual das bases temporais permitia obter os melhores resultados na previsão do valor das ações, nomeadamente considerando apenas os dados do dia anterior ou os dados dos três dias anteriores à previsão. Para efeitos de comparação e análise dos resultados obtidos foi construído um modelo de persistência para o qual são consideradas para o valor de previsão, o valor da ação no dia anterior. Desta forma, consegue-se concluir quais os modelos que apresentam melhores resultados quando se verifica que o Root Mean Squared Error dos modelos é menor que o Root Mean Squared Error do seu modelo de persistência. Por fim tecem-se as conclusões relativamente aos resultados obtidos. De facto, foram encontrados modelos capazes de prever o índice SP500 ou mesmo ações de empresas presentes no índice SP500, mas porque os resultados não se estendem a todas as ações analisadas, essa hipótese não pode ser totalmente corroborada, ainda que dos 8 ativos estudados, 87,5% obteve-se um modelo capaz de prever o preço de ativo melhor que o modelo de persistência. Relativamente às diferenças entre o melhor modelo de cada ativo e o modelo de persistência é possível aferir que as ações com menor volatilidade apresentam diferenças menos significativas.The present dissertation, carried out in the scope of the master’s in industrial engineering and management (MEGI), is the result of an individual project, with the objective of predicting the stock market for a short-term time base, using machine learning models. Only stocks present in the SP500 roughly from 2013 to 2018 were considered for this study. Although stock market forecasting is a challenge that has constantly motivated the scientific community to search for answers since its existence, it is only in recent years with the existing high computational capacity that there have been some models capable of profitably forecasting the stock market (Rouf et al., 2021). It is noteworthy that even these successful cases still show many weaknesses in terms of consistency (Rouf et al., 2021). The purpose of this project is to analyze a set of macro-economic data to conclude if the present factors allow achieving better forecast results than a persistence model, which considers as forecast value the previous day's closing price. To carry out this project we followed the CRISP-DM methodology, widely used in data mining projects. Through this methodology it was possible to define clear work objectives, describe and analyze the dataset used, prepare the data considering the models used, submit the dataset to the three models used, namely the Linear Regression, Random Forest Regression and MultiLayer Perceptron, and finally, draw conclusions based on the results obtained. In the model application phase, it was also taken into consideration to perform sensitivity analyses regarding the parameter values to be used, having as objective function the minimization of the Root Mean Squared Error. It was also studied which of the time bases allowed for the best results in stock price forecasting, namely considering only data from the previous day or data from the three days prior to the forecast. To compare and analyze the results obtained, a persistence model was built for which the forecast value considers the stock value on the previous day. This way, it is possible to conclude which models present the best results when it is verified that the Root Mean Squared Error of the models is smaller than the Root Mean Squared Error of their persistence model. Finally, conclusions are drawn regarding the results obtained. In fact, models capable of predicting the SP500 index or even stocks of companies present in the SP500 index were found, but because the results do not extend to all the analyzed stocks, this hypothesis cannot be fully corroborated, even though of the 8 assets studied, 87.5% obtained a model capable of predicting the asset price better than the persistence model. Regarding the differences between the best model for each asset and the persistence model, it is possible to conclude that stocks with lower volatility present less significant differences.Ferreira, Carlos Manuel Abreu GomesRepositório Científico do Instituto Politécnico do PortoGomes, Mário Roberto dos Reis2023-02-09T15:42:47Z20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/22221TID:203113470porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-13T13:18:48Zoai:recipp.ipp.pt:10400.22/22221Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:42:17.008175Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Análise e modelação do mercado de ações
Stock market analysis and modelling
title Análise e modelação do mercado de ações
spellingShingle Análise e modelação do mercado de ações
Gomes, Mário Roberto dos Reis
Data mining
Machine learning
KNIME
Mercado de ações
Índice SP500
Stock market
SP500 index
title_short Análise e modelação do mercado de ações
title_full Análise e modelação do mercado de ações
title_fullStr Análise e modelação do mercado de ações
title_full_unstemmed Análise e modelação do mercado de ações
title_sort Análise e modelação do mercado de ações
author Gomes, Mário Roberto dos Reis
author_facet Gomes, Mário Roberto dos Reis
author_role author
dc.contributor.none.fl_str_mv Ferreira, Carlos Manuel Abreu Gomes
Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv Gomes, Mário Roberto dos Reis
dc.subject.por.fl_str_mv Data mining
Machine learning
KNIME
Mercado de ações
Índice SP500
Stock market
SP500 index
topic Data mining
Machine learning
KNIME
Mercado de ações
Índice SP500
Stock market
SP500 index
description A presente dissertação, realizada no âmbito do Mestrado em Engenharia e Gestão Industrial (MEGI), é o resultado de um projeto individual, com o objetivo de prever o mercado de ações para uma base temporal de curto prazo, utilizando para isso modelos de machine learning. Foram consideradas para este estudo, apenas ações presentes no SP500 de 2013 a 2018 sensivelmente. Embora a previsão do mercado de ações seja um desafio que tem constantemente motivado a comunidade científica a procurar respostas desde a sua existência, apenas nos últimos anos com a elevada capacidade computacional existente, é que se tem verificado a existência de alguns modelos capazes de prever o mercado de ações de forma lucrativa (Rouf et al., 2021). De realçar que mesmo estes casos de sucesso ainda mostram bastantes fragilidades ao nível da consistência (Rouf et al., 2021). O que se pretende com este projeto é analisar um conjunto de dados macroeconómicos no sentido de concluir se os fatores presentes permitem alcançar melhores resultados de previsão que um modelo de persistência, que considera como valor de previsão, o preço de fecho do dia anterior. Para a realização deste projeto seguiu-se a metodologia CRISP-DM, muito utilizada em projetos de data mining. Através desta metodologia foi possível definir objetivos claros de trabalho, descrever e analisar o dataset utilizado, preparar os dados tendo em conta os modelos utilizados, submeter o dataset aos três modelos utilizados, nomeadamente o Linear Regression, o Random Forest Regression e o MultiLayer Perceptron, e por fim, tecer as devidas conclusões face aos resultados obtidos. Na fase da aplicação dos modelos também se teve em consideração a realização de análises de sensibilidade face aos valores de parâmetros a utilizar, tendo como função objetivo a minimização do erro Root Mean Squared Error. Também foi estudado qual das bases temporais permitia obter os melhores resultados na previsão do valor das ações, nomeadamente considerando apenas os dados do dia anterior ou os dados dos três dias anteriores à previsão. Para efeitos de comparação e análise dos resultados obtidos foi construído um modelo de persistência para o qual são consideradas para o valor de previsão, o valor da ação no dia anterior. Desta forma, consegue-se concluir quais os modelos que apresentam melhores resultados quando se verifica que o Root Mean Squared Error dos modelos é menor que o Root Mean Squared Error do seu modelo de persistência. Por fim tecem-se as conclusões relativamente aos resultados obtidos. De facto, foram encontrados modelos capazes de prever o índice SP500 ou mesmo ações de empresas presentes no índice SP500, mas porque os resultados não se estendem a todas as ações analisadas, essa hipótese não pode ser totalmente corroborada, ainda que dos 8 ativos estudados, 87,5% obteve-se um modelo capaz de prever o preço de ativo melhor que o modelo de persistência. Relativamente às diferenças entre o melhor modelo de cada ativo e o modelo de persistência é possível aferir que as ações com menor volatilidade apresentam diferenças menos significativas.
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-01-01T00:00:00Z
2023-02-09T15:42:47Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/22221
TID:203113470
url http://hdl.handle.net/10400.22/22221
identifier_str_mv TID:203113470
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131509116895232