Document representations and its measurements applied to finance

Detalhes bibliográficos
Autor(a) principal: Bastos, Saulo Benchimol
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio2.unb.br/jspui/handle/10482/47536
Resumo: Tese (doutorado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Departamento de Economia, Programa de Pós-Graduação em Economia, 2019.
id UNB_cf6368c1afd59bb5e60c7071ac900e60
oai_identifier_str oai:repositorio.unb.br:10482/47536
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Document representations and its measurements applied to financeAnálise textualRepresentação da informaçãoAnálise de sentimentoMercado financeiroTese (doutorado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Departamento de Economia, Programa de Pós-Graduação em Economia, 2019.Uma representação de documento é a descrição matemática de um texto. Aprender a representar informação é o passo inicial para uma extração automatizada de conhecimento. Reescrevemos a metodologia para extrair sentimento do texto, presente na literatura econômica, como um problema de recuperação de informação, possibilitando assim a aplicação de técnicas consagradas em ciência da computação. Mostramos que a escolha da ponderação adequada da matriz TF-IDF (frequência do termo-inverso da frequência do documento) e representações densas levam a resultados mais consistentes. Além disso, usamos documentos completos, em vez de versões filtradas com dicionários, como variáveis de séries temporais, o que só foi possível devido a representações densas. Propomos dois modelos para extrair sentimento do texto. Primeiro, um que aprende o vocabulário de acordo com movimentos em uma variável específica. Validamos nosso modelo usando o retorno overnight no mercado de ações; encontramos evidências de que o sentimento prevê retornos, que as notícias em t − 1 têm o maior efeito sobre os retornos em t e que a positividade ou negatividade de uma palavra depende do contexto. Segundo, usamos variáveis quantitativas e texto para criar um vetor de sentimento cujas coordenadas se relacionam entre si, em vez de simples números. Encontramos com sucesso estados opostos em um sentimento bidimensional, otimismo e pessimismo, cujas regressões em variáveis do mercado financeiro produzem resultados que têm amparo em teorias financeiras.A document representation is the mathematical description of a text. Learning how to represent information is the initial step towards an automated extraction of knowledge. We rewrite the methodology to extract sentiment from text, present in economic literature, as an information retrieval problem, thus enabling the application of consecrated techniques in computer science. We show that the choice of an adequate weighting scheme of the TF-IDF (Term-Frequency Inverse-Document-Frequency) matrix and dense representations leads to more consistent results. Also, we use whole documents, instead of filtered versions with dictionaries, as time series variables, which was only possible due to dense representations. We propose two models to extract sentiment from text. First, one that learns the vocabulary according to movements in a specific variable. We validate our model using the overnight return in the stock market; we find evidence that the sentiment predicts returns, that news in t − 1 has the greatest effect on the overnight returns in t, and that the positivity or the negativity of a word depends on the context. Second, we use quantitative variables and text to create a sentiment vector whose coordinates relate to each other, instead of single numbers. We successfully find opposite states in a two dimensional sentiment, optimism and pessimism, whose regressions on financial market variables produce results that are supported by financial theories.Faculdade de Economia, Administração, Contabilidade e Gestão de Políticas Públicas (FACE)Departamento de Economia (FACE ECO)Programa de Pós-Graduação em EconomiaCajueiro, Daniel OliveiraBastos, Saulo Benchimol2024-01-27T14:49:27Z2024-01-27T14:49:27Z2024-01-272019-06-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBASTOS, Saulo Benchimol. Document representations and its measurements applied to finance. 2019. 116 f., il. Tese (Doutorado em Economia) — Universidade de Brasília, Brasília, 2019.http://repositorio2.unb.br/jspui/handle/10482/47536enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-02-05T15:04:57Zoai:repositorio.unb.br:10482/47536Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-02-05T15:04:57Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Document representations and its measurements applied to finance
title Document representations and its measurements applied to finance
spellingShingle Document representations and its measurements applied to finance
Bastos, Saulo Benchimol
Análise textual
Representação da informação
Análise de sentimento
Mercado financeiro
title_short Document representations and its measurements applied to finance
title_full Document representations and its measurements applied to finance
title_fullStr Document representations and its measurements applied to finance
title_full_unstemmed Document representations and its measurements applied to finance
title_sort Document representations and its measurements applied to finance
author Bastos, Saulo Benchimol
author_facet Bastos, Saulo Benchimol
author_role author
dc.contributor.none.fl_str_mv Cajueiro, Daniel Oliveira
dc.contributor.author.fl_str_mv Bastos, Saulo Benchimol
dc.subject.por.fl_str_mv Análise textual
Representação da informação
Análise de sentimento
Mercado financeiro
topic Análise textual
Representação da informação
Análise de sentimento
Mercado financeiro
description Tese (doutorado) — Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Departamento de Economia, Departamento de Economia, Programa de Pós-Graduação em Economia, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019-06-28
2024-01-27T14:49:27Z
2024-01-27T14:49:27Z
2024-01-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BASTOS, Saulo Benchimol. Document representations and its measurements applied to finance. 2019. 116 f., il. Tese (Doutorado em Economia) — Universidade de Brasília, Brasília, 2019.
http://repositorio2.unb.br/jspui/handle/10482/47536
identifier_str_mv BASTOS, Saulo Benchimol. Document representations and its measurements applied to finance. 2019. 116 f., il. Tese (Doutorado em Economia) — Universidade de Brasília, Brasília, 2019.
url http://repositorio2.unb.br/jspui/handle/10482/47536
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508339375112192