Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/12796 |
Resumo: | In the cryptocurrency market, Bitcoin stands out as the most accepted traded in the world. However, due to its high volatility, the prediction of price behaviors, in special, the trend classification, becomes a challenge and valuable to investors. In this sense, in recent years, some studies have been proposed based on machine learning techniques to classify reliable trading signals from the Bitcoin return series. Thus, the present work explores Bitcoin's trend behaviors, seeking to classify its returns using high-frequency data from limit order book in terms of US dollar (BTCUSD) and euro (BTCEUR). The proposed methodology seeks to accurately predict returns, creating opportunities that better support trading strategies. Therefore, from the Bitcoin historical series, technical indicators (commonly used in financial markets), market variables and the own series of returns for different time intervals were extracted. It is worth mentioning that the data have a frequency of at most one second for each update of the entire order book, thus characterizing the high-frequency. Subsequently, these data are submitted to the inputs of trend classifiers based on Artificial Neural Networks and XGBoost, which were trained and validated in three months of trading, from January to March 2019, composing approximately 5 million market updates for each currency base. In a first analysis, the behaviors of the models for each base currency were observed, it is possible to note that the market for BTCUSD proves to be more efficient related to BTCEUR. Consequently, the machine learning models obtained more reliable and stable results over time for BTCUSD. Based on this initial result, sought to validate the predictive models for different training and validation configurations. In this second analysis, it was noted that the trend classification is more accurate for short intervals (between 1 and 3 minutes) in both base currencies, which is justified due to the high volatility in Bitcoin prices in short intervals. In a third analysis, it was observed that as we increased the number of training days for classifiers, in some cases, was noted a gradual loss in classification (between 1% and 2%). Still, in a fourth analysis, one-vs.-rest was applied to each trend behavior, there is a considerable performance increase in the classification in relation to the base case (between 1% and 7%) |
id |
SCAR_1225594766b8db72e94c511961142f4a |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/12796 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Emílio, João Mateus ArcoliniFernandes, Ricardo Augusto Souzahttp://lattes.cnpq.br/0880243208789454http://lattes.cnpq.br/5077328227235621c8fe1b1b-98b1-4cd6-811f-9c73c6d610b92020-05-22T23:55:19Z2020-05-22T23:55:19Z2020-03-10EMÍLIO, João Mateus Arcolini. Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12796.https://repositorio.ufscar.br/handle/ufscar/12796In the cryptocurrency market, Bitcoin stands out as the most accepted traded in the world. However, due to its high volatility, the prediction of price behaviors, in special, the trend classification, becomes a challenge and valuable to investors. In this sense, in recent years, some studies have been proposed based on machine learning techniques to classify reliable trading signals from the Bitcoin return series. Thus, the present work explores Bitcoin's trend behaviors, seeking to classify its returns using high-frequency data from limit order book in terms of US dollar (BTCUSD) and euro (BTCEUR). The proposed methodology seeks to accurately predict returns, creating opportunities that better support trading strategies. Therefore, from the Bitcoin historical series, technical indicators (commonly used in financial markets), market variables and the own series of returns for different time intervals were extracted. It is worth mentioning that the data have a frequency of at most one second for each update of the entire order book, thus characterizing the high-frequency. Subsequently, these data are submitted to the inputs of trend classifiers based on Artificial Neural Networks and XGBoost, which were trained and validated in three months of trading, from January to March 2019, composing approximately 5 million market updates for each currency base. In a first analysis, the behaviors of the models for each base currency were observed, it is possible to note that the market for BTCUSD proves to be more efficient related to BTCEUR. Consequently, the machine learning models obtained more reliable and stable results over time for BTCUSD. Based on this initial result, sought to validate the predictive models for different training and validation configurations. In this second analysis, it was noted that the trend classification is more accurate for short intervals (between 1 and 3 minutes) in both base currencies, which is justified due to the high volatility in Bitcoin prices in short intervals. In a third analysis, it was observed that as we increased the number of training days for classifiers, in some cases, was noted a gradual loss in classification (between 1% and 2%). Still, in a fourth analysis, one-vs.-rest was applied to each trend behavior, there is a considerable performance increase in the classification in relation to the base case (between 1% and 7%)No mercado de criptomoedas, o Bitcoin destaca-se como a mais aceita e negociada no mundo. Entretanto, devido à sua alta volatilidade, a predição de comportamentos de preços, em especial a classificação de tendência, torna-se um desafio e é de grande interesse aos investidores. Neste sentido, nos últimos anos, alguns estudos foram propostos com base em técnicas de aprendizado de máquina com a intenção de classificar sinais viáveis de negociação a partir da série de retornos do Bitcoin. Assim, o presente trabalho explora comportamentos de tendência do Bitcoin, buscando classificar seu retorno por meio de dados de alta frequência referentes às ordens do livro de ofertas em termos de dólar americano (BTCUSD) e euro (BTCEUR). A metodologia proposta busca predizer retornos com precisão, criando oportunidades que deem melhor suporte às estratégias de negociação. Para tanto, a partir das séries históricas do Bitcoin, foram extraídos indicadores técnicos (comumente empregados em mercados financeiros), variáveis de mercado e a própria série de retornos para diferentes intervalos temporais. Cabe mencionar que os dados possuem uma frequência de no máximo um segundo para cada atualização de todo livro de ofertas, caracterizando assim a alta frequência. Na sequência, estes dados são submetidos às entradas de classificadores de tendência baseados em Redes Neurais Artificiais e XGBoost, os quais foram treinados e validados em três meses de negociação, de Janeiro a Março de 2019, compondo aproximadamente 5 milhões de atualizações do mercado para cada moeda base. Em uma primeira análise foram observados os comportamentos dos modelos para cada moeda base, sendo possível notar que o mercado para BTCUSD se demonstra mais eficiente em relação à BTCEUR. Consequentemente, os modelos de aprendizado de máquina obtiveram resultados mais confiáveis e estáveis ao longo do tempo para BTCUSD. Partindo desse resultado inicial, buscou-se validar os modelos preditivos para distintas configurações de treinamento e validação. Nesta segunda análise, notou-se que a classificação das tendências mostra-se mais precisa para intervalos curtos (entre 1 e 3 minutos) em ambas as moedas base, o que é justificável devido a alta volatilidade nos preços do Bitcoin em curtos intervalos de tempo. Em uma terceira análise, observou-se que à medida que a quantidade de dias no conjunto de treinamento é incrementada, em alguns casos, nota-se uma perda gradativa de desempenho na classificação (entre 1% e 2%). Ainda, em uma quarta análise, aplicou-se one-vs.-rest para cada comportamento de tendência, verifica-se um aumento de desempenho considerável na classificação em relação ao caso base (entre 1% e %7)Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessAprendizado de máquinaMicroestrutura de mercadoNegociação algorítmicaAlta frequênciaMachine LearningHigh-frequencyMarket microstructureAlgorithmic tradingBitcoinCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOClassificação de retornos utilizando dados de alta frequência no mercado de bitcoinsBitcoin return classification using high-frequency datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis600600bb8d173a-edce-4320-a3d9-7d30ffae1cf9reponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALtexto_dissertacao.pdftexto_dissertacao.pdfTexto da dissertaçãoapplication/pdf1018087https://repositorio.ufscar.br/bitstream/ufscar/12796/3/texto_dissertacao.pdfc69ef4760c383cbcdb6b11798ba7d830MD53aceite_orientador.pdfaceite_orientador.pdfAceite orientadorapplication/pdf150236https://repositorio.ufscar.br/bitstream/ufscar/12796/2/aceite_orientador.pdf51096e68b2e76d66646bd79e51f37deaMD52CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstream/ufscar/12796/4/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD54TEXTtexto_dissertacao.pdf.txttexto_dissertacao.pdf.txtExtracted texttext/plain100224https://repositorio.ufscar.br/bitstream/ufscar/12796/5/texto_dissertacao.pdf.txt7124a7212b7a8b93bb56239f341ce734MD55aceite_orientador.pdf.txtaceite_orientador.pdf.txtExtracted texttext/plain1308https://repositorio.ufscar.br/bitstream/ufscar/12796/7/aceite_orientador.pdf.txt41c642c1eeb42329c46957c554c8ffa0MD57THUMBNAILtexto_dissertacao.pdf.jpgtexto_dissertacao.pdf.jpgIM Thumbnailimage/jpeg6352https://repositorio.ufscar.br/bitstream/ufscar/12796/6/texto_dissertacao.pdf.jpgbc35acd484e5ee99d302ad7ca48cc3abMD56aceite_orientador.pdf.jpgaceite_orientador.pdf.jpgIM Thumbnailimage/jpeg10775https://repositorio.ufscar.br/bitstream/ufscar/12796/8/aceite_orientador.pdf.jpg3039a22f4809dceb3da60505b2f0c614MD58ufscar/127962023-09-18 18:31:55.075oai:repositorio.ufscar.br:ufscar/12796Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:55Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins |
dc.title.alternative.eng.fl_str_mv |
Bitcoin return classification using high-frequency data |
title |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins |
spellingShingle |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins Emílio, João Mateus Arcolini Aprendizado de máquina Microestrutura de mercado Negociação algorítmica Alta frequência Machine Learning High-frequency Market microstructure Algorithmic trading Bitcoin CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
title_short |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins |
title_full |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins |
title_fullStr |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins |
title_full_unstemmed |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins |
title_sort |
Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins |
author |
Emílio, João Mateus Arcolini |
author_facet |
Emílio, João Mateus Arcolini |
author_role |
author |
dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/5077328227235621 |
dc.contributor.author.fl_str_mv |
Emílio, João Mateus Arcolini |
dc.contributor.advisor1.fl_str_mv |
Fernandes, Ricardo Augusto Souza |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0880243208789454 |
dc.contributor.authorID.fl_str_mv |
c8fe1b1b-98b1-4cd6-811f-9c73c6d610b9 |
contributor_str_mv |
Fernandes, Ricardo Augusto Souza |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Microestrutura de mercado Negociação algorítmica Alta frequência |
topic |
Aprendizado de máquina Microestrutura de mercado Negociação algorítmica Alta frequência Machine Learning High-frequency Market microstructure Algorithmic trading Bitcoin CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Machine Learning High-frequency Market microstructure Algorithmic trading Bitcoin |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::MATEMATICA DA COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
description |
In the cryptocurrency market, Bitcoin stands out as the most accepted traded in the world. However, due to its high volatility, the prediction of price behaviors, in special, the trend classification, becomes a challenge and valuable to investors. In this sense, in recent years, some studies have been proposed based on machine learning techniques to classify reliable trading signals from the Bitcoin return series. Thus, the present work explores Bitcoin's trend behaviors, seeking to classify its returns using high-frequency data from limit order book in terms of US dollar (BTCUSD) and euro (BTCEUR). The proposed methodology seeks to accurately predict returns, creating opportunities that better support trading strategies. Therefore, from the Bitcoin historical series, technical indicators (commonly used in financial markets), market variables and the own series of returns for different time intervals were extracted. It is worth mentioning that the data have a frequency of at most one second for each update of the entire order book, thus characterizing the high-frequency. Subsequently, these data are submitted to the inputs of trend classifiers based on Artificial Neural Networks and XGBoost, which were trained and validated in three months of trading, from January to March 2019, composing approximately 5 million market updates for each currency base. In a first analysis, the behaviors of the models for each base currency were observed, it is possible to note that the market for BTCUSD proves to be more efficient related to BTCEUR. Consequently, the machine learning models obtained more reliable and stable results over time for BTCUSD. Based on this initial result, sought to validate the predictive models for different training and validation configurations. In this second analysis, it was noted that the trend classification is more accurate for short intervals (between 1 and 3 minutes) in both base currencies, which is justified due to the high volatility in Bitcoin prices in short intervals. In a third analysis, it was observed that as we increased the number of training days for classifiers, in some cases, was noted a gradual loss in classification (between 1% and 2%). Still, in a fourth analysis, one-vs.-rest was applied to each trend behavior, there is a considerable performance increase in the classification in relation to the base case (between 1% and 7%) |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-05-22T23:55:19Z |
dc.date.available.fl_str_mv |
2020-05-22T23:55:19Z |
dc.date.issued.fl_str_mv |
2020-03-10 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
EMÍLIO, João Mateus Arcolini. Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12796. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/12796 |
identifier_str_mv |
EMÍLIO, João Mateus Arcolini. Classificação de retornos utilizando dados de alta frequência no mercado de bitcoins. 2020. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/ufscar/12796. |
url |
https://repositorio.ufscar.br/handle/ufscar/12796 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
600 600 |
dc.relation.authority.fl_str_mv |
bb8d173a-edce-4320-a3d9-7d30ffae1cf9 |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
dc.publisher.initials.fl_str_mv |
UFSCar |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/12796/3/texto_dissertacao.pdf https://repositorio.ufscar.br/bitstream/ufscar/12796/2/aceite_orientador.pdf https://repositorio.ufscar.br/bitstream/ufscar/12796/4/license_rdf https://repositorio.ufscar.br/bitstream/ufscar/12796/5/texto_dissertacao.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/12796/7/aceite_orientador.pdf.txt https://repositorio.ufscar.br/bitstream/ufscar/12796/6/texto_dissertacao.pdf.jpg https://repositorio.ufscar.br/bitstream/ufscar/12796/8/aceite_orientador.pdf.jpg |
bitstream.checksum.fl_str_mv |
c69ef4760c383cbcdb6b11798ba7d830 51096e68b2e76d66646bd79e51f37dea e39d27027a6cc9cb039ad269a5db8e34 7124a7212b7a8b93bb56239f341ce734 41c642c1eeb42329c46957c554c8ffa0 bc35acd484e5ee99d302ad7ca48cc3ab 3039a22f4809dceb3da60505b2f0c614 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136374225141760 |