Time-Series Analysis Framework

Detalhes bibliográficos
Autor(a) principal: Costa, Pedro Moreira
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/87308
Resumo: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
id RCAP_c2c6c593478c52fa419f0dc7f76b20b1
oai_identifier_str oai:estudogeral.uc.pt:10316/87308
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Time-Series Analysis FrameworkFramework de Análise de Séries TemporaisSéries TemporaisPrevisãoDeteção de AnomaliasAprendizagem de Máquina AutomáticaOtimização BayesianaTime SeriesForecastingAnomaly DetectionAuto-MLBayesian OptimizationDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaUma série temporal é uma estrutura de dados que relaciona uma observação de um evento com um instante de tempo e o tipo de dados que é utilizado numa variedade de áreas, cuja análise providencia uma compreensão mais sensata em relação ao comportamento de um evento.É comum a análise de séries temporais ser desempenhada com recurso a visualizações gráficas e modelos clássicos. No entanto, os modelos de ML têm recebido atenção no estado da arte, no que diz respeito a previsão e deteção de anomalias, uma vez que apresentam resultados comparáveis, tendo em conta restrições de tempo e de dados. No entanto, uma das maiores desvantagens destes métodos é o custo associado a obter a melhor configuração de pré-processamento de dados, seleção do modelo e a sua parametrização.Deste modo, o objectivo principal deste projeto trata por reduzir a complexidade associada à escolha do tipo de processamento de dados, seleção de modelo e a sua parametrização, através de um seletor automático de abordagens, baseado em Raciocínio Baseado em Casos e Otimização Bayesiana, tanto para uma framework de previsão, como uma de deteção de anomalias.A framework deve gerir métodos de previsão e deteção de anomalias para séries temporais uni e multivariadas, de diferentes categorias e constituídas por diferentes atributos para fornecer a abordagem ótima.Os resultados recolhidos para cada tipo de análise, por cada tipo de série temporal, foram comprometidos por insuficiência de exemplos, especialmente nos casos de séries temporais multivariadas. No entanto, para séries temporais univariadas, os resultados são mais razoáveis.O impacto de Otimização Bayesiana mostra que todos os modelos aos quais foi aplicada apresentavam resultados com um erro aceitável, demonstrando-se uma mais-valia.A time series consists of a data structure that relates an event observation with a time instance. It is the type of data that occurs in a variety of fields and whose analysis (such as Forecasting and Anomaly Detection) provides a more sensitive understanding regarding events' behavior. Time series analysis is usually carried out through the use of plots and classical models. However, ML approaches have seen a rise in the state of art for Forecasting and Anomaly Detection because they provide comparable results at appropriate time and data constraints. However, one of their major drawbacks is how costly it is to obtain the best data preparation, model selection and parametrization. With this in mind, this work's main goal is overcoming the complexity involved with data processing, model selection and model tuning, through the support of an autonomous approach selector, based on CBR and Bayesian Optimization, present in both forecasting and anomaly detection frameworks. The framework handles UTS for Forecasting and MTS for Forecasting and Anomaly Detection of different categories and bearing different attributes to deliver an optimized approach.The drawn results for each type of analysis, for each type of time series, suffer from insufficient examples, especially MTS, but, for Forecasting UTS, the model selection results show an averaged Macro weighted F1-score of 0.38. Regarding the effects of Bayesian Optimization, all models produced results within an acceptable error (sMAPE lower than 16% and F1-score higher than 0.60), proving the efficacy of this component.2019-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/87308http://hdl.handle.net/10316/87308TID:202267245engCosta, Pedro Moreirainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2020-05-25T03:38:00Zoai:estudogeral.uc.pt:10316/87308Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:08:15.528075Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Time-Series Analysis Framework
Framework de Análise de Séries Temporais
title Time-Series Analysis Framework
spellingShingle Time-Series Analysis Framework
Costa, Pedro Moreira
Séries Temporais
Previsão
Deteção de Anomalias
Aprendizagem de Máquina Automática
Otimização Bayesiana
Time Series
Forecasting
Anomaly Detection
Auto-ML
Bayesian Optimization
title_short Time-Series Analysis Framework
title_full Time-Series Analysis Framework
title_fullStr Time-Series Analysis Framework
title_full_unstemmed Time-Series Analysis Framework
title_sort Time-Series Analysis Framework
author Costa, Pedro Moreira
author_facet Costa, Pedro Moreira
author_role author
dc.contributor.author.fl_str_mv Costa, Pedro Moreira
dc.subject.por.fl_str_mv Séries Temporais
Previsão
Deteção de Anomalias
Aprendizagem de Máquina Automática
Otimização Bayesiana
Time Series
Forecasting
Anomaly Detection
Auto-ML
Bayesian Optimization
topic Séries Temporais
Previsão
Deteção de Anomalias
Aprendizagem de Máquina Automática
Otimização Bayesiana
Time Series
Forecasting
Anomaly Detection
Auto-ML
Bayesian Optimization
description Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
publishDate 2019
dc.date.none.fl_str_mv 2019-07-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/87308
http://hdl.handle.net/10316/87308
TID:202267245
url http://hdl.handle.net/10316/87308
identifier_str_mv TID:202267245
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133975088726016