Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20102023-152926/ |
Resumo: | A viabilidade de obter lucro por meio de negociação em alta frequência de um único ativo financeiro é uma questão de pesquisa em aberto. O aprendizado por reforço (RL) e a análise de sentimentos textual (SA) são cada vez mais relevantes para esse problema financeiro. Notavelmente, apesar de sua proeminência, as técnicas de RL e SA raramente foram combinadas para aprender estratégias de negociação de ativos. Além disso, os tópicos não abordados incluem: capturar o impulso do sentimento do mercado por meio da extração explícita de características de sentimento que refletem a condição do mercado ao longo do tempo; e verificar se tal incorporação de informações aos algoritmos de RL não afeta negativamente a consistência e estabilidade em diferentes situações. O presente trabalho propõe que o Sentiment-Aware Reinforcement Learning Intelligent Trading System (ITS-SentARL) preencha esta lacuna. O ITS-SentARL melhora o lucro e a estabilidade ao alavancar o humor do mercado por meio de uma faixa ajustável de recursos de sentimentos obtidos de notícias textuais. Ao contrário de pesquisas anteriores, projetamos um extrator de sentimentos de acordo com o design vencedor da rede neural convolucional da competição de análise de sentimentos SemEval-2017 { o treinamento desse extrator de sentimentos foi feito com dados rotulados por especialistas de mercado. Depois de treinar o extrator de sentimento, ele pode ser usado para pontuar novos dados e usá-los como parte da representação de estado de um algoritmo Advantage Actor-Critic (A2C), uma abordagem RL. Tanto uma estratégia A2C sem sentimentos quanto a estratégia clássica de compra e retenção (BH) são usadas como linhas de base. A avaliação da arquitetura ITS-SentARL ocorre em vinte ativos financeiros, dois custos de transação e cinco diferentes períodos e inicializações. Notavelmente, os resultados mostram que o agente ITS-SentARL superou consistentemente o agente de negociação A2C de linha de base para diversas situações de mercado e, em alguns cenários, também a estratégia BH. Os resultados sugerem que a incorporação do sentimento de mercado é benéfica, mas depende da quantidade de notícias divulgadas e sua correlação com o preço. |
id |
USP_196e7c2eca3ac059e0ba4fcfcb105088 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-20102023-152926 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente.Assimilating sentiment analysis in reinforcement learning for intelligent trading.Deep neural networksInteligência artificialLinguagem naturalMercado financeiroMétodos estatísticos para aprendizagemNatural language processingRedes neuraisReinforcement learningSentiment analysisStock marketsA viabilidade de obter lucro por meio de negociação em alta frequência de um único ativo financeiro é uma questão de pesquisa em aberto. O aprendizado por reforço (RL) e a análise de sentimentos textual (SA) são cada vez mais relevantes para esse problema financeiro. Notavelmente, apesar de sua proeminência, as técnicas de RL e SA raramente foram combinadas para aprender estratégias de negociação de ativos. Além disso, os tópicos não abordados incluem: capturar o impulso do sentimento do mercado por meio da extração explícita de características de sentimento que refletem a condição do mercado ao longo do tempo; e verificar se tal incorporação de informações aos algoritmos de RL não afeta negativamente a consistência e estabilidade em diferentes situações. O presente trabalho propõe que o Sentiment-Aware Reinforcement Learning Intelligent Trading System (ITS-SentARL) preencha esta lacuna. O ITS-SentARL melhora o lucro e a estabilidade ao alavancar o humor do mercado por meio de uma faixa ajustável de recursos de sentimentos obtidos de notícias textuais. Ao contrário de pesquisas anteriores, projetamos um extrator de sentimentos de acordo com o design vencedor da rede neural convolucional da competição de análise de sentimentos SemEval-2017 { o treinamento desse extrator de sentimentos foi feito com dados rotulados por especialistas de mercado. Depois de treinar o extrator de sentimento, ele pode ser usado para pontuar novos dados e usá-los como parte da representação de estado de um algoritmo Advantage Actor-Critic (A2C), uma abordagem RL. Tanto uma estratégia A2C sem sentimentos quanto a estratégia clássica de compra e retenção (BH) são usadas como linhas de base. A avaliação da arquitetura ITS-SentARL ocorre em vinte ativos financeiros, dois custos de transação e cinco diferentes períodos e inicializações. Notavelmente, os resultados mostram que o agente ITS-SentARL superou consistentemente o agente de negociação A2C de linha de base para diversas situações de mercado e, em alguns cenários, também a estratégia BH. Os resultados sugerem que a incorporação do sentimento de mercado é benéfica, mas depende da quantidade de notícias divulgadas e sua correlação com o preço.The viability of attaining prot through high-frequency active trading of a single asset is an open research question. Reinforcement learning (RL) and textual sentiment analysis (SA) are increasingly relevant for this nancial task. Notably, despite their prominence, RL and SA techniques have rarely been combined for learning asset trading strategies. Furthermore, unaddressed topics include: capturing market sentiment momentum through the explicit extraction of sentiment features that re ect the market condition over time; and verifying that such information incorporation to RL algorithms does not negatively aect consistency and stability in dierent situations. The present work proposes that the Sentiment-Aware Reinforcement Learning Intelligent Trading System (ITS-SentARL) lls this gap. ITS-SentARL improves prot and stability by leveraging market mood through an adjustable range of past sentiment features obtained from textual news. Unlike previous research, a sentiment extractor was designed according to the convolutional neural network winning design of the renowned SemEval-2017 sentiment analysis competition { the training of this sentiment extractor was done with data labeled by market specialists. After training the sentiment extractor, it can be used to score new data and use it as part of the state representation of an Advantage Actor-Critic (A2C) algorithm, an RL approach. Both a sentiment-free A2C and the classical buy-and-hold (BH) strategy are used as baselines. The evaluation of ITS-SentARL architecture occurs over twenty assets, two transaction costs, and ve dierent periods and initializations. Remarkably, the results show that the ITS-SentARL agent consistently outperformed the baseline sentiment-free A2C trading agent for diverse market situations and, in some scenarios, also the BH strategy. Results suggest that market sentiment incorporation is benecial but depends on the amount of news released and its correlation to the price.Biblioteca Digitais de Teses e Dissertações da USPCosta, Anna Helena RealiPaiva, Francisco Caio Lima2023-04-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-20102023-152926/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T12:45:09Zoai:teses.usp.br:tde-20102023-152926Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T12:45:09Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. Assimilating sentiment analysis in reinforcement learning for intelligent trading. |
title |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. |
spellingShingle |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. Paiva, Francisco Caio Lima Deep neural networks Inteligência artificial Linguagem natural Mercado financeiro Métodos estatísticos para aprendizagem Natural language processing Redes neurais Reinforcement learning Sentiment analysis Stock markets |
title_short |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. |
title_full |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. |
title_fullStr |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. |
title_full_unstemmed |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. |
title_sort |
Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente. |
author |
Paiva, Francisco Caio Lima |
author_facet |
Paiva, Francisco Caio Lima |
author_role |
author |
dc.contributor.none.fl_str_mv |
Costa, Anna Helena Reali |
dc.contributor.author.fl_str_mv |
Paiva, Francisco Caio Lima |
dc.subject.por.fl_str_mv |
Deep neural networks Inteligência artificial Linguagem natural Mercado financeiro Métodos estatísticos para aprendizagem Natural language processing Redes neurais Reinforcement learning Sentiment analysis Stock markets |
topic |
Deep neural networks Inteligência artificial Linguagem natural Mercado financeiro Métodos estatísticos para aprendizagem Natural language processing Redes neurais Reinforcement learning Sentiment analysis Stock markets |
description |
A viabilidade de obter lucro por meio de negociação em alta frequência de um único ativo financeiro é uma questão de pesquisa em aberto. O aprendizado por reforço (RL) e a análise de sentimentos textual (SA) são cada vez mais relevantes para esse problema financeiro. Notavelmente, apesar de sua proeminência, as técnicas de RL e SA raramente foram combinadas para aprender estratégias de negociação de ativos. Além disso, os tópicos não abordados incluem: capturar o impulso do sentimento do mercado por meio da extração explícita de características de sentimento que refletem a condição do mercado ao longo do tempo; e verificar se tal incorporação de informações aos algoritmos de RL não afeta negativamente a consistência e estabilidade em diferentes situações. O presente trabalho propõe que o Sentiment-Aware Reinforcement Learning Intelligent Trading System (ITS-SentARL) preencha esta lacuna. O ITS-SentARL melhora o lucro e a estabilidade ao alavancar o humor do mercado por meio de uma faixa ajustável de recursos de sentimentos obtidos de notícias textuais. Ao contrário de pesquisas anteriores, projetamos um extrator de sentimentos de acordo com o design vencedor da rede neural convolucional da competição de análise de sentimentos SemEval-2017 { o treinamento desse extrator de sentimentos foi feito com dados rotulados por especialistas de mercado. Depois de treinar o extrator de sentimento, ele pode ser usado para pontuar novos dados e usá-los como parte da representação de estado de um algoritmo Advantage Actor-Critic (A2C), uma abordagem RL. Tanto uma estratégia A2C sem sentimentos quanto a estratégia clássica de compra e retenção (BH) são usadas como linhas de base. A avaliação da arquitetura ITS-SentARL ocorre em vinte ativos financeiros, dois custos de transação e cinco diferentes períodos e inicializações. Notavelmente, os resultados mostram que o agente ITS-SentARL superou consistentemente o agente de negociação A2C de linha de base para diversas situações de mercado e, em alguns cenários, também a estratégia BH. Os resultados sugerem que a incorporação do sentimento de mercado é benéfica, mas depende da quantidade de notícias divulgadas e sua correlação com o preço. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-04-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20102023-152926/ |
url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20102023-152926/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256522103455744 |