Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins

Detalhes bibliográficos
Autor(a) principal: Emílio, João Mateus Arcolini
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/12796
Resumo: In the cryptocurrency market, Bitcoin stands out as the most accepted traded in the world. However, due to its high volatility, the prediction of price behaviors, in special, the trend classification, becomes a challenge and valuable to investors. In this sense, in recent years, some studies have been proposed based on machine learning techniques to classify reliable trading signals from the Bitcoin return series. Thus, the present work explores Bitcoin's trend behaviors, seeking to classify its returns using high-frequency data from limit order book in terms of US dollar (BTCUSD) and euro (BTCEUR). The proposed methodology seeks to accurately predict returns, creating opportunities that better support trading strategies. Therefore, from the Bitcoin historical series, technical indicators (commonly used in financial markets), market variables and the own series of returns for different time intervals were extracted. It is worth mentioning that the data have a frequency of at most one second for each update of the entire order book, thus characterizing the high-frequency. Subsequently, these data are submitted to the inputs of trend classifiers based on Artificial Neural Networks and XGBoost, which were trained and validated in three months of trading, from January to March 2019, composing approximately 5 million market updates for each currency base. In a first analysis, the behaviors of the models for each base currency were observed, it is possible to note that the market for BTCUSD proves to be more efficient related to BTCEUR. Consequently, the machine learning models obtained more reliable and stable results over time for BTCUSD. Based on this initial result, sought to validate the predictive models for different training and validation configurations. In this second analysis, it was noted that the trend classification is more accurate for short intervals (between 1 and 3 minutes) in both base currencies, which is justified due to the high volatility in Bitcoin prices in short intervals. In a third analysis, it was observed that as we increased the number of training days for classifiers, in some cases, was noted a gradual loss in classification (between 1% and 2%). Still, in a fourth analysis, one-vs.-rest was applied to each trend behavior, there is a considerable performance increase in the classification in relation to the base case (between 1% and 7%)
id SCAR_1225594766b8db72e94c511961142f4a
oai_identifier_str oai:repositorio.ufscar.br:ufscar/12796
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Emílio, João Mateus ArcoliniFernandes, Ricardo Augusto Souzahttp://lattes.cnpq.br/0880243208789454http://lattes.cnpq.br/5077328227235621c8fe1b1b-98b1-4cd6-811f-9c73c6d610b92020-05-22T23:55:19Z2020-05-22T23:55:19Z2020-03-10EMÍLIO, João Mateus Arcolini. Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12796.https://repositorio.ufscar.br/handle/ufscar/12796In the cryptocurrency market, Bitcoin stands out as the most accepted traded in the world. However, due to its high volatility, the prediction of price behaviors, in special, the trend classification, becomes a challenge and valuable to investors. In this sense, in recent years, some studies have been proposed based on machine learning techniques to classify reliable trading signals from the Bitcoin return series. Thus, the present work explores Bitcoin's trend behaviors, seeking to classify its returns using high-frequency data from limit order book in terms of US dollar (BTCUSD) and euro (BTCEUR). The proposed methodology seeks to accurately predict returns, creating opportunities that better support trading strategies. Therefore, from the Bitcoin historical series, technical indicators (commonly used in financial markets), market variables and the own series of returns for different time intervals were extracted. It is worth mentioning that the data have a frequency of at most one second for each update of the entire order book, thus characterizing the high-frequency. Subsequently, these data are submitted to the inputs of trend classifiers based on Artificial Neural Networks and XGBoost, which were trained and validated in three months of trading, from January to March 2019, composing approximately 5 million market updates for each currency base. In a first analysis, the behaviors of the models for each base currency were observed, it is possible to note that the market for BTCUSD proves to be more efficient related to BTCEUR. Consequently, the machine learning models obtained more reliable and stable results over time for BTCUSD. Based on this initial result, sought to validate the predictive models for different training and validation configurations. In this second analysis, it was noted that the trend classification is more accurate for short intervals (between 1 and 3 minutes) in both base currencies, which is justified due to the high volatility in Bitcoin prices in short intervals. In a third analysis, it was observed that as we increased the number of training days for classifiers, in some cases, was noted a gradual loss in classification (between 1% and 2%). Still, in a fourth analysis, one-vs.-rest was applied to each trend behavior, there is a considerable performance increase in the classification in relation to the base case (between 1% and 7%)No mercado de criptomoedas, o Bitcoin destaca-se como a mais aceita e negociada no mundo. Entretanto, devido à sua alta volatilidade, a predição de comportamentos de preços, em especial a classificação de tendência, torna-se um desafio e é de grande interesse aos investidores. Neste sentido, nos últimos anos, alguns estudos foram propostos com base em técnicas de aprendizado de máquina com a intenção de classificar sinais viáveis de negociação a partir da série de retornos do Bitcoin. Assim, o presente trabalho explora comportamentos de tendência do Bitcoin, buscando classificar seu retorno por meio de dados de alta frequência referentes às ordens do livro de ofertas em termos de dólar americano (BTCUSD) e euro (BTCEUR). A metodologia proposta busca predizer retornos com precisão, criando oportunidades que deem melhor suporte às estratégias de negociação. Para tanto, a partir das séries históricas do Bitcoin, foram extraídos indicadores técnicos (comumente empregados em mercados financeiros), variáveis de mercado e a própria série de retornos para diferentes intervalos temporais. Cabe mencionar que os dados possuem uma frequência de no máximo um segundo para cada atualização de todo livro de ofertas, caracterizando assim a alta frequência. Na sequência, estes dados são submetidos às entradas de classificadores de tendência baseados em Redes Neurais Artificiais e XGBoost, os quais foram treinados e validados em três meses de negociação, de Janeiro a Março de 2019, compondo aproximadamente 5 milhões de atualizações do mercado para cada moeda base. Em uma primeira análise foram observados os comportamentos dos modelos para cada moeda base, sendo possível notar que o mercado para BTCUSD se demonstra mais eficiente em relação à BTCEUR. Consequentemente, os modelos de aprendizado de máquina obtiveram resultados mais confiáveis e estáveis ao longo do tempo para BTCUSD. Partindo desse resultado inicial, buscou-se validar os modelos preditivos para distintas configurações de treinamento e validação. Nesta segunda análise, notou-se que a classificação das tendências mostra-se mais precisa para intervalos curtos (entre 1 e 3 minutos) em ambas as moedas base, o que é justificável devido a alta volatilidade nos preços do Bitcoin em curtos intervalos de tempo. Em uma terceira análise, observou-se que à medida que a quantidade de dias no conjunto de treinamento é incrementada, em alguns casos, nota-se uma perda gradativa de desempenho na classificação (entre 1% e 2%). Ainda, em uma quarta análise, aplicou-se one-vs.-rest para cada comportamento de tendência, verifica-se um aumento de desempenho considerável na classificação em relação ao caso base (entre 1% e %7)Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAprendizado de máquinaMicroestrutura de mercadoNegociação algorítmicaAlta frequênciaMachine LearningHigh-frequencyMarket microstructureAlgorithmic tradingBitcoinCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOClassificação de retornos utilizando dados de alta frequência no mercado de bitcoinsBitcoin return classification using high-frequency datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis600600bb8d173a-edce-4320-a3d9-7d30ffae1cf9reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALtexto_dissertacao.pdftexto_dissertacao.pdfTexto da dissertaçãoapplication/pdf1018087https://repositorio.ufscar.br/bitstream/ufscar/12796/3/texto_dissertacao.pdfc69ef4760c383cbcdb6b11798ba7d830MD53aceite_orientador.pdfaceite_orientador.pdfAceite orientadorapplication/pdf150236https://repositorio.ufscar.br/bitstream/ufscar/12796/2/aceite_orientador.pdf51096e68b2e76d66646bd79e51f37deaMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/12796/4/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD54TEXTtexto_dissertacao.pdf.txttexto_dissertacao.pdf.txtExtracted texttext/plain100224https://repositorio.ufscar.br/bitstream/ufscar/12796/5/texto_dissertacao.pdf.txt7124a7212b7a8b93bb56239f341ce734MD55aceite_orientador.pdf.txtaceite_orientador.pdf.txtExtracted texttext/plain1308https://repositorio.ufscar.br/bitstream/ufscar/12796/7/aceite_orientador.pdf.txt41c642c1eeb42329c46957c554c8ffa0MD57THUMBNAILtexto_dissertacao.pdf.jpgtexto_dissertacao.pdf.jpgIM Thumbnailimage/jpeg6352https://repositorio.ufscar.br/bitstream/ufscar/12796/6/texto_dissertacao.pdf.jpgbc35acd484e5ee99d302ad7ca48cc3abMD56aceite_orientador.pdf.jpgaceite_orientador.pdf.jpgIM Thumbnailimage/jpeg10775https://repositorio.ufscar.br/bitstream/ufscar/12796/8/aceite_orientador.pdf.jpg3039a22f4809dceb3da60505b2f0c614MD58ufscar/127962023-09-18 18:31:55.075oai:repositorio.ufscar.br:ufscar/12796Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:55Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
dc.title.alternative.eng.fl_str_mv Bitcoin return classification using high-frequency data
title Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
spellingShingle Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
Emílio, João Mateus Arcolini
Aprendizado de máquina
Microestrutura de mercado
Negociação algorítmica
Alta frequência
Machine Learning
High-frequency
Market microstructure
Algorithmic trading
Bitcoin
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
title_full Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
title_fullStr Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
title_full_unstemmed Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
title_sort Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
author Emílio, João Mateus Arcolini
author_facet Emílio, João Mateus Arcolini
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/5077328227235621
dc.contributor.author.fl_str_mv Emílio, João Mateus Arcolini
dc.contributor.advisor1.fl_str_mv Fernandes, Ricardo Augusto Souza
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0880243208789454
dc.contributor.authorID.fl_str_mv c8fe1b1b-98b1-4cd6-811f-9c73c6d610b9
contributor_str_mv Fernandes, Ricardo Augusto Souza
dc.subject.por.fl_str_mv Aprendizado de máquina
Microestrutura de mercado
Negociação algorítmica
Alta frequência
topic Aprendizado de máquina
Microestrutura de mercado
Negociação algorítmica
Alta frequência
Machine Learning
High-frequency
Market microstructure
Algorithmic trading
Bitcoin
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Machine Learning
High-frequency
Market microstructure
Algorithmic trading
Bitcoin
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description In the cryptocurrency market, Bitcoin stands out as the most accepted traded in the world. However, due to its high volatility, the prediction of price behaviors, in special, the trend classification, becomes a challenge and valuable to investors. In this sense, in recent years, some studies have been proposed based on machine learning techniques to classify reliable trading signals from the Bitcoin return series. Thus, the present work explores Bitcoin's trend behaviors, seeking to classify its returns using high-frequency data from limit order book in terms of US dollar (BTCUSD) and euro (BTCEUR). The proposed methodology seeks to accurately predict returns, creating opportunities that better support trading strategies. Therefore, from the Bitcoin historical series, technical indicators (commonly used in financial markets), market variables and the own series of returns for different time intervals were extracted. It is worth mentioning that the data have a frequency of at most one second for each update of the entire order book, thus characterizing the high-frequency. Subsequently, these data are submitted to the inputs of trend classifiers based on Artificial Neural Networks and XGBoost, which were trained and validated in three months of trading, from January to March 2019, composing approximately 5 million market updates for each currency base. In a first analysis, the behaviors of the models for each base currency were observed, it is possible to note that the market for BTCUSD proves to be more efficient related to BTCEUR. Consequently, the machine learning models obtained more reliable and stable results over time for BTCUSD. Based on this initial result, sought to validate the predictive models for different training and validation configurations. In this second analysis, it was noted that the trend classification is more accurate for short intervals (between 1 and 3 minutes) in both base currencies, which is justified due to the high volatility in Bitcoin prices in short intervals. In a third analysis, it was observed that as we increased the number of training days for classifiers, in some cases, was noted a gradual loss in classification (between 1% and 2%). Still, in a fourth analysis, one-vs.-rest was applied to each trend behavior, there is a considerable performance increase in the classification in relation to the base case (between 1% and 7%)
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-05-22T23:55:19Z
dc.date.available.fl_str_mv 2020-05-22T23:55:19Z
dc.date.issued.fl_str_mv 2020-03-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv EMÍLIO, João Mateus Arcolini. Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12796.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/12796
identifier_str_mv EMÍLIO, João Mateus Arcolini. Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12796.
url https://repositorio.ufscar.br/handle/ufscar/12796
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv bb8d173a-edce-4320-a3d9-7d30ffae1cf9
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/12796/3/texto_dissertacao.pdf
https://repositorio.ufscar.br/bitstream/ufscar/12796/2/aceite_orientador.pdf
https://repositorio.ufscar.br/bitstream/ufscar/12796/4/license_rdf
https://repositorio.ufscar.br/bitstream/ufscar/12796/5/texto_dissertacao.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/12796/7/aceite_orientador.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/12796/6/texto_dissertacao.pdf.jpg
https://repositorio.ufscar.br/bitstream/ufscar/12796/8/aceite_orientador.pdf.jpg
bitstream.checksum.fl_str_mv c69ef4760c383cbcdb6b11798ba7d830
51096e68b2e76d66646bd79e51f37dea
e39d27027a6cc9cb039ad269a5db8e34
7124a7212b7a8b93bb56239f341ce734
41c642c1eeb42329c46957c554c8ffa0
bc35acd484e5ee99d302ad7ca48cc3ab
3039a22f4809dceb3da60505b2f0c614
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136374225141760