Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo

Detalhes bibliográficos
Autor(a) principal: Castro, Katy Sylvia Batista
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/123456789/23455
Resumo: The task of clustering is part of everyday life and human nature. The literature that deals with clustering provides techniques, metrics and algorithms to accomplish this task. In particular, the clustering of observed data over time and in the form of intervals represents a challenge, with new methods being proposed for this purpose. The advantage of adaptive distances is that they assign different weights to the variables of clusters, and an algorithm that succeeds in adapting to this can bring results far superior to algorithms that treat all variables in the same way, with the same level of importance. Moreover, kernelization makes it possible to work with data in a new space, different from the original space, where the groups will present a better separation. The objective of this work is to consider new distances for the KMeans method in the clustering of interval time series. We will use adaptive distances and distances calculated through the kernelization of the metric and the feature space. To validate the proposed algorithms, we performed a study with time series generated from the parameters of Space-Time Autoregressive (STAR) models, using Monte Carlo simulations as well as real data. The comparison will take place through external and internal indices. The results obtained in the simulations demonstrate that the proposed algorithms performed better than the existing methods. The application to real data considered cryptocurrency series and traditional indices such as gold, oil, stock exchanges, among others. The results point to insights that can be used for future work in machine learning and economics.
id UFPB_4ad0f2db61fa6e8ebe42861b0b06cb83
oai_identifier_str oai:repositorio.ufpb.br:123456789/23455
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervaloDistâncias adaptativasDistâncias kernelizadasAgrupamento de séries temporaisCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe task of clustering is part of everyday life and human nature. The literature that deals with clustering provides techniques, metrics and algorithms to accomplish this task. In particular, the clustering of observed data over time and in the form of intervals represents a challenge, with new methods being proposed for this purpose. The advantage of adaptive distances is that they assign different weights to the variables of clusters, and an algorithm that succeeds in adapting to this can bring results far superior to algorithms that treat all variables in the same way, with the same level of importance. Moreover, kernelization makes it possible to work with data in a new space, different from the original space, where the groups will present a better separation. The objective of this work is to consider new distances for the KMeans method in the clustering of interval time series. We will use adaptive distances and distances calculated through the kernelization of the metric and the feature space. To validate the proposed algorithms, we performed a study with time series generated from the parameters of Space-Time Autoregressive (STAR) models, using Monte Carlo simulations as well as real data. The comparison will take place through external and internal indices. The results obtained in the simulations demonstrate that the proposed algorithms performed better than the existing methods. The application to real data considered cryptocurrency series and traditional indices such as gold, oil, stock exchanges, among others. The results point to insights that can be used for future work in machine learning and economics.NenhumaA tarefa de agrupar faz parte do cotidiano e da natureza humana. A literatura que trata de agrupamentos disponibiliza técnicas, métricas e algoritmos para realizar essa tarefa. Em particular, o agrupamento de dados observados ao longo do tempo e em forma de intervalos representa um desafio, com novos métodos sendo propostos para essa finalidade. A vantagem das distâncias adaptativas é que elas atribuem pesos diferentes às variáveis do agrupamentos, e um algoritmo que consegue se adaptar a isso pode trazer resultados muito superiores aos algoritmos que tratam todas as variáveis da mesma forma, com o mesmo nível de importância. Ademais, a kernelização torna possível trabalhar com dados em um novo espaço, diferente do espaço original, onde os grupos venham a apresentar uma melhor separação. O objetivo deste trabalho é considerar novas distâncias para o método K-Means no agrupamento de séries temporais de dados tipo intervalo. Utilizaremos distâncias adaptativas e distâncias calculadas através da kernelização da métrica e do espaço de características. Para validar os algoritmos propostos realizamos um estudo com séries temporais geradas a partir dos parâmetros de modelos Autorregressivo Espaço-Tempo (STAR, do inglês Space-Time Autoregressive), utilizando simulações Monte Carlo, bem como dados reais. A comparação dar-se-á através de índices externos e internos. Os resultados obtidos nas simulações demonstram que os algoritmos propostos apresentaram desempenho superior em relação aos métodos existentes. A aplicação a dados reais considerou séries de criptomoedas e índices tradicionais como ouro, petróleo, bolsas de valores, entre outros. Os resultados apontam insights que poderão ser usados para trabalhos futuros na área de aprendizagem de máquina e economia.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em Modelagem Matemática e computacionalUFPBLima Neto, Eufrásio de Andradehttp://lattes.cnpq.br/5580004940091667Ferreira, Marcelo R. Portelahttp://lattes.cnpq.br/2620157217100077Castro, Katy Sylvia Batista2022-07-14T20:34:50Z2022-04-272022-07-14T20:34:50Z2022-03-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://repositorio.ufpb.br/jspui/handle/123456789/23455porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2022-08-09T12:33:50Zoai:repositorio.ufpb.br:123456789/23455Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2022-08-09T12:33:50Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
title Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
spellingShingle Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
Castro, Katy Sylvia Batista
Distâncias adaptativas
Distâncias kernelizadas
Agrupamento de séries temporais
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
title_full Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
title_fullStr Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
title_full_unstemmed Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
title_sort Distâncias adaptativas e kernelizadas aplicadas a agrupamento de séries temporais tipo intervalo
author Castro, Katy Sylvia Batista
author_facet Castro, Katy Sylvia Batista
author_role author
dc.contributor.none.fl_str_mv Lima Neto, Eufrásio de Andrade
http://lattes.cnpq.br/5580004940091667
Ferreira, Marcelo R. Portela
http://lattes.cnpq.br/2620157217100077
dc.contributor.author.fl_str_mv Castro, Katy Sylvia Batista
dc.subject.por.fl_str_mv Distâncias adaptativas
Distâncias kernelizadas
Agrupamento de séries temporais
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Distâncias adaptativas
Distâncias kernelizadas
Agrupamento de séries temporais
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The task of clustering is part of everyday life and human nature. The literature that deals with clustering provides techniques, metrics and algorithms to accomplish this task. In particular, the clustering of observed data over time and in the form of intervals represents a challenge, with new methods being proposed for this purpose. The advantage of adaptive distances is that they assign different weights to the variables of clusters, and an algorithm that succeeds in adapting to this can bring results far superior to algorithms that treat all variables in the same way, with the same level of importance. Moreover, kernelization makes it possible to work with data in a new space, different from the original space, where the groups will present a better separation. The objective of this work is to consider new distances for the KMeans method in the clustering of interval time series. We will use adaptive distances and distances calculated through the kernelization of the metric and the feature space. To validate the proposed algorithms, we performed a study with time series generated from the parameters of Space-Time Autoregressive (STAR) models, using Monte Carlo simulations as well as real data. The comparison will take place through external and internal indices. The results obtained in the simulations demonstrate that the proposed algorithms performed better than the existing methods. The application to real data considered cryptocurrency series and traditional indices such as gold, oil, stock exchanges, among others. The results point to insights that can be used for future work in machine learning and economics.
publishDate 2022
dc.date.none.fl_str_mv 2022-07-14T20:34:50Z
2022-04-27
2022-07-14T20:34:50Z
2022-03-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/23455
url https://repositorio.ufpb.br/jspui/handle/123456789/23455
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Modelagem Matemática e computacional
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Modelagem Matemática e computacional
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1801842996011859968