Um modelo de proveniência para extração de tendências em séries temporais

Detalhes bibliográficos
Autor(a) principal: Souza, Lucelia de
Data de Publicação: 2014
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: http://hdl.handle.net/1884/40316
Resumo: Orientador : Prof. Dr. Marcos Sfair Sunye
id UFPR_2eb1bde28c918caddf3834b1cb8e5304
oai_identifier_str oai:acervodigital.ufpr.br:1884/40316
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Souza, Lucelia deVaz, Maria Salete Marcon GomesUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaSunye, Marcos Sfair, 1964-2015-12-02T15:06:39Z2015-12-02T15:06:39Z2014http://hdl.handle.net/1884/40316Orientador : Prof. Dr. Marcos Sfair SunyeCo-orientadora : Profa. Dra. Maria Salete Marcon Gomes VazTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 29/08/2014Inclui referências : f. 201-216Resumo: Muitas áreas do conhecimento estão relacionadas com a análise de séries temporais, as quais são constituídas por uma sequencia de observações de dados sobre o tempo. A análise de séries temporais difere da análise de dados tradicional, dada sua natureza intrínseca, onde as observações são dependentes. Nesse caso, procedimentos estatísticos considerando a independência dos dados não se aplicam, sendo necessário o uso de métodos específicos. Geralmente, a análise de séries temporais ocorre em duas fases, pré-processamento e análise dos dados. Na fase de pré-processamento, são feitas correções para remoção de fenômenos que ocorrem ao longo do tempo, como a extração de tendências (detrending). Vários softwares de detrending podem ser aplicados para esse fim, melhorando a análise, assim como a maioria dos métodos estatísticos são desenvolvidos para séries temporais estacionárias. Em um processo de detrending, informações de proveniência sobre as séries temporais e como as mesmas foram corrigidas de tendências nem sempre são explícitas e de fácil interpretação. Tais informações podem ser obtidas pelo uso de metadados, os quais podem gerar ambiguidades nos resultados gerados, assim como podem ser insuficientes para semanticamente enriquecer o processo de detrending. Por outro lado, ontologias permitem gerar e compartilhar conhecimento sobre as séries temporais e sobre os métodos estatísticos aplicados para sua correção, assim como permitem inferências. O principal objetivo desta tese é definir um modelo de proveniência usando ontologias para enriquecer semanticamente a extração de tendências em séries temporais. O modelo é validado por um estudo de caso com séries temporais fotométricas reais. A principal contribuição é a geração de conhecimento semântico, permitindo identificar, além dos dados, agentes e processos envolvidos, informações quanto aos métodos estatísticos usados para detrending, facilitando o entendimento de como as séries temporais foram geradas e corrigidas, melhorando a tomada de decisão quanto ao uso de métodos estatísticos. O ineditismo desta tese é a definição de um modelo de proveniência para extração de tendências, apresentando um projeto modular, centrado no reuso e na extensão de ontologias para gerar proveniência sobre séries temporais e processos de detrending, enriquecendo semanticamente um passo relevante da fase de pré-processamento da análise de séries temporais, contribuindo para a geração do conhecimento científico. Palavras-chave: Modelo de Proveniência, Ontologias, OWL, Séries Temporais Não-Estacionárias, Extração de TendênciasAbstract: Nowadays, many knowledge areas are related with the time series analysis, which are constituted by a sequence of data observation at the time. The time series analysis is different from the traditional data analysis, due to their intrinsic nature, where the observations are dependent. In this case, statistical procedures considering the data?s independence are not applied, being necessary the use of specific methods. Usually, the time series analysis occurs in two phases, preprocessing and data analysis. In the preprocessing phase, corrections are done to remove phenomena that occur throughout the time, like the trend extraction (detrending). Many detrending software can be applied for this objective, improving the analysis, as well as the most of statistical methods are developed to stationary time series. In a detrending process, provenance information about the time series and how the time series were detrended are not always explicit and easy to interpret. Such information can be obtained by metadata, which can generate ambiguity in the results generated and they can also be insufficient to semantically enrich the detrending process. On the other hand, ontologies allow generating and sharing knowledge about the time series and on the statistical methods used for it?s correction, as well as allow inferences. The main goal of this doctoral thesis is to define a provenance model using ontologies to semantically enrich the trend extraction of time series. The model is validated by a case study involving real photometric time series. The main contribution is the semantic knowledge generation, allowing to identify, besides the data, agents and process involved, information about the statistical methods used for detrending, facilitating the understanding about how the time series were generated and corrected, improving the decision making related with the statistical methods applicability. The novelty of this doctoral thesis is the definition of a provenance model for trend extraction, presenting a modular design, centered on reuse and on the ontologies extension to generate provenance about time series and detrending processes, enriching semantically a relevant step of preprocessing phase of the time series analysis, contributing to the generation of the scientific knowledge. Keywords: Provenance Model, Ontologies, OWL, Nonstationary Time Series, Detrending256 f. : il., grafs., tabs.application/pdfDisponível em formato digitalCiência da computaçãoUm modelo de proveniência para extração de tendências em séries temporaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessTEXTR - T - LUCELIA DE SOUZA.pdf.txtExtracted Texttext/plain600652https://acervodigital.ufpr.br/bitstream/1884/40316/1/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.txt8228f1091eb03862462e555a61c0bcfaMD51open accessORIGINALR - T - LUCELIA DE SOUZA.pdfapplication/pdf10605099https://acervodigital.ufpr.br/bitstream/1884/40316/2/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf70a1d17288e1c3770617196286155b15MD52open accessTHUMBNAILR - T - LUCELIA DE SOUZA.pdf.jpgR - T - LUCELIA DE SOUZA.pdf.jpgGenerated Thumbnailimage/jpeg1183https://acervodigital.ufpr.br/bitstream/1884/40316/3/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.jpg70eafdde97b59482e1b76f7cccace1cbMD53open access1884/403162016-04-07 05:37:42.234open accessoai:acervodigital.ufpr.br:1884/40316Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-07T08:37:42Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.none.fl_str_mv Um modelo de proveniência para extração de tendências em séries temporais
title Um modelo de proveniência para extração de tendências em séries temporais
spellingShingle Um modelo de proveniência para extração de tendências em séries temporais
Souza, Lucelia de
Ciência da computação
title_short Um modelo de proveniência para extração de tendências em séries temporais
title_full Um modelo de proveniência para extração de tendências em séries temporais
title_fullStr Um modelo de proveniência para extração de tendências em séries temporais
title_full_unstemmed Um modelo de proveniência para extração de tendências em séries temporais
title_sort Um modelo de proveniência para extração de tendências em séries temporais
author Souza, Lucelia de
author_facet Souza, Lucelia de
author_role author
dc.contributor.other.none.fl_str_mv Vaz, Maria Salete Marcon Gomes
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.author.fl_str_mv Souza, Lucelia de
dc.contributor.advisor1.fl_str_mv Sunye, Marcos Sfair, 1964-
contributor_str_mv Sunye, Marcos Sfair, 1964-
dc.subject.por.fl_str_mv Ciência da computação
topic Ciência da computação
description Orientador : Prof. Dr. Marcos Sfair Sunye
publishDate 2014
dc.date.issued.fl_str_mv 2014
dc.date.accessioned.fl_str_mv 2015-12-02T15:06:39Z
dc.date.available.fl_str_mv 2015-12-02T15:06:39Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1884/40316
url http://hdl.handle.net/1884/40316
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 256 f. : il., grafs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/40316/1/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/40316/2/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf
https://acervodigital.ufpr.br/bitstream/1884/40316/3/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.jpg
bitstream.checksum.fl_str_mv 8228f1091eb03862462e555a61c0bcfa
70a1d17288e1c3770617196286155b15
70eafdde97b59482e1b76f7cccace1cb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860309954068480