Time-Series Analysis Framework
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/87308 |
Resumo: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_c2c6c593478c52fa419f0dc7f76b20b1 |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/87308 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Time-Series Analysis FrameworkFramework de Análise de Séries TemporaisSéries TemporaisPrevisãoDeteção de AnomaliasAprendizagem de Máquina AutomáticaOtimização BayesianaTime SeriesForecastingAnomaly DetectionAuto-MLBayesian OptimizationDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaUma série temporal é uma estrutura de dados que relaciona uma observação de um evento com um instante de tempo e o tipo de dados que é utilizado numa variedade de áreas, cuja análise providencia uma compreensão mais sensata em relação ao comportamento de um evento.É comum a análise de séries temporais ser desempenhada com recurso a visualizações gráficas e modelos clássicos. No entanto, os modelos de ML têm recebido atenção no estado da arte, no que diz respeito a previsão e deteção de anomalias, uma vez que apresentam resultados comparáveis, tendo em conta restrições de tempo e de dados. No entanto, uma das maiores desvantagens destes métodos é o custo associado a obter a melhor configuração de pré-processamento de dados, seleção do modelo e a sua parametrização.Deste modo, o objectivo principal deste projeto trata por reduzir a complexidade associada à escolha do tipo de processamento de dados, seleção de modelo e a sua parametrização, através de um seletor automático de abordagens, baseado em Raciocínio Baseado em Casos e Otimização Bayesiana, tanto para uma framework de previsão, como uma de deteção de anomalias.A framework deve gerir métodos de previsão e deteção de anomalias para séries temporais uni e multivariadas, de diferentes categorias e constituídas por diferentes atributos para fornecer a abordagem ótima.Os resultados recolhidos para cada tipo de análise, por cada tipo de série temporal, foram comprometidos por insuficiência de exemplos, especialmente nos casos de séries temporais multivariadas. No entanto, para séries temporais univariadas, os resultados são mais razoáveis.O impacto de Otimização Bayesiana mostra que todos os modelos aos quais foi aplicada apresentavam resultados com um erro aceitável, demonstrando-se uma mais-valia.A time series consists of a data structure that relates an event observation with a time instance. It is the type of data that occurs in a variety of fields and whose analysis (such as Forecasting and Anomaly Detection) provides a more sensitive understanding regarding events' behavior. Time series analysis is usually carried out through the use of plots and classical models. However, ML approaches have seen a rise in the state of art for Forecasting and Anomaly Detection because they provide comparable results at appropriate time and data constraints. However, one of their major drawbacks is how costly it is to obtain the best data preparation, model selection and parametrization. With this in mind, this work's main goal is overcoming the complexity involved with data processing, model selection and model tuning, through the support of an autonomous approach selector, based on CBR and Bayesian Optimization, present in both forecasting and anomaly detection frameworks. The framework handles UTS for Forecasting and MTS for Forecasting and Anomaly Detection of different categories and bearing different attributes to deliver an optimized approach.The drawn results for each type of analysis, for each type of time series, suffer from insufficient examples, especially MTS, but, for Forecasting UTS, the model selection results show an averaged Macro weighted F1-score of 0.38. Regarding the effects of Bayesian Optimization, all models produced results within an acceptable error (sMAPE lower than 16% and F1-score higher than 0.60), proving the efficacy of this component.2019-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/87308http://hdl.handle.net/10316/87308TID:202267245engCosta, Pedro Moreirainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2020-05-25T03:38:00Zoai:estudogeral.uc.pt:10316/87308Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:08:15.528075Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Time-Series Analysis Framework Framework de Análise de Séries Temporais |
title |
Time-Series Analysis Framework |
spellingShingle |
Time-Series Analysis Framework Costa, Pedro Moreira Séries Temporais Previsão Deteção de Anomalias Aprendizagem de Máquina Automática Otimização Bayesiana Time Series Forecasting Anomaly Detection Auto-ML Bayesian Optimization |
title_short |
Time-Series Analysis Framework |
title_full |
Time-Series Analysis Framework |
title_fullStr |
Time-Series Analysis Framework |
title_full_unstemmed |
Time-Series Analysis Framework |
title_sort |
Time-Series Analysis Framework |
author |
Costa, Pedro Moreira |
author_facet |
Costa, Pedro Moreira |
author_role |
author |
dc.contributor.author.fl_str_mv |
Costa, Pedro Moreira |
dc.subject.por.fl_str_mv |
Séries Temporais Previsão Deteção de Anomalias Aprendizagem de Máquina Automática Otimização Bayesiana Time Series Forecasting Anomaly Detection Auto-ML Bayesian Optimization |
topic |
Séries Temporais Previsão Deteção de Anomalias Aprendizagem de Máquina Automática Otimização Bayesiana Time Series Forecasting Anomaly Detection Auto-ML Bayesian Optimization |
description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-07-08 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/87308 http://hdl.handle.net/10316/87308 TID:202267245 |
url |
http://hdl.handle.net/10316/87308 |
identifier_str_mv |
TID:202267245 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133975088726016 |