Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.5/23029 |
Resumo: | Mestrado Bolonha em Mathematical Finance |
id |
RCAP_92b0723d1347f151454f90ee7d31c94f |
---|---|
oai_identifier_str |
oai:www.repository.utl.pt:10400.5/23029 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACFBig DataSéries TemporaisAgrupamento de séries temporaisperiodograma fragmentadoACF fragmentadoTime SeriesTime Series ClusteringFragmented-periodogramFragmented-ACFMestrado Bolonha em Mathematical FinanceBig data faz, cada vez mais, parte do nosso dia a dia e tem um impacto cada vez maior na nossa sociedade. Tem entusiasmado os investigadores para encontrarem novos métodos para lidar com conjuntos de dados muito grandes. Na análise das séries temporais, a mesma necessidade surge. Há algumas décadas, os investigadores batalhavam para encontrar séries de dados longas o suficiente para as analisar; hoje em dia, estão frequentemente sobrecarregados com conjuntos de dados que são demasiado grandes para lidar com métodos tradicionais. O objetivo deste trabalho é estudar e propor métodos para medir as semelhanças e diferenças entre diferentes séries temporais. Esses métodos devem ser computacionalmente simples e perdem, naturalmente, algumas informações, mas devem ser capazes de fornecer métricas que são adequadas para agrupar grandes conjuntos para extensas séries temporais. Para ser mais específica, estudo um método muito recente chamado periodograma fragmentado e confirmo por simulação, a sua utilidade para fornecer uma medida simples que leva ao agrupamento correto das séries temporais em consideração. Esta replicação dá al- gum conforto quanto à correção do exercício e leva a uma descoberta interessante sobre as regras de fragmentação. Portanto, proponho um método equivalente no domínio do tempo, o ACF fragmentado, e confirmo por simulação a sua utilidade. Finalmente, comparo os dois métodos e concluo que o ACF fragmentado tem um desempenho comparável, senão superior. As simulações são, naturalmente, limitadas a classes particulares de modelos, o que abre espaço para pesquisas futuras, como discuto na secção final.Big data is increasingly having a large impact on our society and prompting researchers to find novel methods to deal with very large data sets. In time series analysis, the same need arises. A few decades ago, researchers were struggling to find long enough data series for their analysis; nowadays, they are often overwhelmed with data sets that are too large to handle with traditional methods. The aim of this work is to study and propose methods for measuring the similarities and dissimilarities among different time series. These methods should be computationally simple and naturally lose some information, but they should be able to provide metrics that are suitable for clustering large sets on long time series. To be more specific, I study a very recent method called fragmented periodogram and confirm by simulation its usefulness to provide a simple measure that leads to correct clustering of the time series under consideration. This replication gives some comfort as to the correctness of the exercise and leads to an interesting finding regarding the fragmenting rules. Then, I propose an equivalent method in time domain, the fragmented ACF and confirm by simulation its usefulness. Finally, I compare the two methods and conclude that the frag- mented ACF has a comparable if not superior performance. The simulations are naturally limited to particular classes of models, which opens room for further research, as I discuss in the final section.Instituto Superior de Economia e GestãoCrato, NunoRepositório da Universidade de LisboaAlbino, Andreia Filipa Martins2022-01-12T18:56:31Z2021-102021-10-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/23029engAlbino, Andreia Filipa Martins (2021). "Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-06T14:52:33Zoai:www.repository.utl.pt:10400.5/23029Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:07:20.724511Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF |
title |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF |
spellingShingle |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF Albino, Andreia Filipa Martins Big Data Séries Temporais Agrupamento de séries temporais periodograma fragmentado ACF fragmentado Time Series Time Series Clustering Fragmented-periodogram Fragmented-ACF |
title_short |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF |
title_full |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF |
title_fullStr |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF |
title_full_unstemmed |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF |
title_sort |
Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF |
author |
Albino, Andreia Filipa Martins |
author_facet |
Albino, Andreia Filipa Martins |
author_role |
author |
dc.contributor.none.fl_str_mv |
Crato, Nuno Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Albino, Andreia Filipa Martins |
dc.subject.por.fl_str_mv |
Big Data Séries Temporais Agrupamento de séries temporais periodograma fragmentado ACF fragmentado Time Series Time Series Clustering Fragmented-periodogram Fragmented-ACF |
topic |
Big Data Séries Temporais Agrupamento de séries temporais periodograma fragmentado ACF fragmentado Time Series Time Series Clustering Fragmented-periodogram Fragmented-ACF |
description |
Mestrado Bolonha em Mathematical Finance |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-10 2021-10-01T00:00:00Z 2022-01-12T18:56:31Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/23029 |
url |
http://hdl.handle.net/10400.5/23029 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
Albino, Andreia Filipa Martins (2021). "Comparing the cluster efficiency of fragmental-periodogram and fragmented-ACF". Dissertação de Mestrado, Universidade de Lisboa. Instituto Superior de Economia e Gestão. |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
publisher.none.fl_str_mv |
Instituto Superior de Economia e Gestão |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131166839668736 |