Um modelo de proveniência para extração de tendências em séries temporais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | http://hdl.handle.net/1884/40316 |
Resumo: | Orientador : Prof. Dr. Marcos Sfair Sunye |
id |
UFPR_2eb1bde28c918caddf3834b1cb8e5304 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/40316 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Souza, Lucelia deVaz, Maria Salete Marcon GomesUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaSunye, Marcos Sfair, 1964-2015-12-02T15:06:39Z2015-12-02T15:06:39Z2014http://hdl.handle.net/1884/40316Orientador : Prof. Dr. Marcos Sfair SunyeCo-orientadora : Profa. Dra. Maria Salete Marcon Gomes VazTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 29/08/2014Inclui referências : f. 201-216Resumo: Muitas áreas do conhecimento estão relacionadas com a análise de séries temporais, as quais são constituídas por uma sequencia de observações de dados sobre o tempo. A análise de séries temporais difere da análise de dados tradicional, dada sua natureza intrínseca, onde as observações são dependentes. Nesse caso, procedimentos estatísticos considerando a independência dos dados não se aplicam, sendo necessário o uso de métodos específicos. Geralmente, a análise de séries temporais ocorre em duas fases, pré-processamento e análise dos dados. Na fase de pré-processamento, são feitas correções para remoção de fenômenos que ocorrem ao longo do tempo, como a extração de tendências (detrending). Vários softwares de detrending podem ser aplicados para esse fim, melhorando a análise, assim como a maioria dos métodos estatísticos são desenvolvidos para séries temporais estacionárias. Em um processo de detrending, informações de proveniência sobre as séries temporais e como as mesmas foram corrigidas de tendências nem sempre são explícitas e de fácil interpretação. Tais informações podem ser obtidas pelo uso de metadados, os quais podem gerar ambiguidades nos resultados gerados, assim como podem ser insuficientes para semanticamente enriquecer o processo de detrending. Por outro lado, ontologias permitem gerar e compartilhar conhecimento sobre as séries temporais e sobre os métodos estatísticos aplicados para sua correção, assim como permitem inferências. O principal objetivo desta tese é definir um modelo de proveniência usando ontologias para enriquecer semanticamente a extração de tendências em séries temporais. O modelo é validado por um estudo de caso com séries temporais fotométricas reais. A principal contribuição é a geração de conhecimento semântico, permitindo identificar, além dos dados, agentes e processos envolvidos, informações quanto aos métodos estatísticos usados para detrending, facilitando o entendimento de como as séries temporais foram geradas e corrigidas, melhorando a tomada de decisão quanto ao uso de métodos estatísticos. O ineditismo desta tese é a definição de um modelo de proveniência para extração de tendências, apresentando um projeto modular, centrado no reuso e na extensão de ontologias para gerar proveniência sobre séries temporais e processos de detrending, enriquecendo semanticamente um passo relevante da fase de pré-processamento da análise de séries temporais, contribuindo para a geração do conhecimento científico. Palavras-chave: Modelo de Proveniência, Ontologias, OWL, Séries Temporais Não-Estacionárias, Extração de TendênciasAbstract: Nowadays, many knowledge areas are related with the time series analysis, which are constituted by a sequence of data observation at the time. The time series analysis is different from the traditional data analysis, due to their intrinsic nature, where the observations are dependent. In this case, statistical procedures considering the data?s independence are not applied, being necessary the use of specific methods. Usually, the time series analysis occurs in two phases, preprocessing and data analysis. In the preprocessing phase, corrections are done to remove phenomena that occur throughout the time, like the trend extraction (detrending). Many detrending software can be applied for this objective, improving the analysis, as well as the most of statistical methods are developed to stationary time series. In a detrending process, provenance information about the time series and how the time series were detrended are not always explicit and easy to interpret. Such information can be obtained by metadata, which can generate ambiguity in the results generated and they can also be insufficient to semantically enrich the detrending process. On the other hand, ontologies allow generating and sharing knowledge about the time series and on the statistical methods used for it?s correction, as well as allow inferences. The main goal of this doctoral thesis is to define a provenance model using ontologies to semantically enrich the trend extraction of time series. The model is validated by a case study involving real photometric time series. The main contribution is the semantic knowledge generation, allowing to identify, besides the data, agents and process involved, information about the statistical methods used for detrending, facilitating the understanding about how the time series were generated and corrected, improving the decision making related with the statistical methods applicability. The novelty of this doctoral thesis is the definition of a provenance model for trend extraction, presenting a modular design, centered on reuse and on the ontologies extension to generate provenance about time series and detrending processes, enriching semantically a relevant step of preprocessing phase of the time series analysis, contributing to the generation of the scientific knowledge. Keywords: Provenance Model, Ontologies, OWL, Nonstationary Time Series, Detrending256 f. : il., grafs., tabs.application/pdfDisponível em formato digitalCiência da computaçãoUm modelo de proveniência para extração de tendências em séries temporaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessTEXTR - T - LUCELIA DE SOUZA.pdf.txtExtracted Texttext/plain600652https://acervodigital.ufpr.br/bitstream/1884/40316/1/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.txt8228f1091eb03862462e555a61c0bcfaMD51open accessORIGINALR - T - LUCELIA DE SOUZA.pdfapplication/pdf10605099https://acervodigital.ufpr.br/bitstream/1884/40316/2/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf70a1d17288e1c3770617196286155b15MD52open accessTHUMBNAILR - T - LUCELIA DE SOUZA.pdf.jpgR - T - LUCELIA DE SOUZA.pdf.jpgGenerated Thumbnailimage/jpeg1183https://acervodigital.ufpr.br/bitstream/1884/40316/3/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.jpg70eafdde97b59482e1b76f7cccace1cbMD53open access1884/403162016-04-07 05:37:42.234open accessoai:acervodigital.ufpr.br:1884/40316Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082016-04-07T08:37:42Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.none.fl_str_mv |
Um modelo de proveniência para extração de tendências em séries temporais |
title |
Um modelo de proveniência para extração de tendências em séries temporais |
spellingShingle |
Um modelo de proveniência para extração de tendências em séries temporais Souza, Lucelia de Ciência da computação |
title_short |
Um modelo de proveniência para extração de tendências em séries temporais |
title_full |
Um modelo de proveniência para extração de tendências em séries temporais |
title_fullStr |
Um modelo de proveniência para extração de tendências em séries temporais |
title_full_unstemmed |
Um modelo de proveniência para extração de tendências em séries temporais |
title_sort |
Um modelo de proveniência para extração de tendências em séries temporais |
author |
Souza, Lucelia de |
author_facet |
Souza, Lucelia de |
author_role |
author |
dc.contributor.other.none.fl_str_mv |
Vaz, Maria Salete Marcon Gomes Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática |
dc.contributor.author.fl_str_mv |
Souza, Lucelia de |
dc.contributor.advisor1.fl_str_mv |
Sunye, Marcos Sfair, 1964- |
contributor_str_mv |
Sunye, Marcos Sfair, 1964- |
dc.subject.por.fl_str_mv |
Ciência da computação |
topic |
Ciência da computação |
description |
Orientador : Prof. Dr. Marcos Sfair Sunye |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014 |
dc.date.accessioned.fl_str_mv |
2015-12-02T15:06:39Z |
dc.date.available.fl_str_mv |
2015-12-02T15:06:39Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1884/40316 |
url |
http://hdl.handle.net/1884/40316 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
Disponível em formato digital |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
256 f. : il., grafs., tabs. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/40316/1/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.txt https://acervodigital.ufpr.br/bitstream/1884/40316/2/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf https://acervodigital.ufpr.br/bitstream/1884/40316/3/R%20-%20T%20-%20LUCELIA%20DE%20SOUZA.pdf.jpg |
bitstream.checksum.fl_str_mv |
8228f1091eb03862462e555a61c0bcfa 70a1d17288e1c3770617196286155b15 70eafdde97b59482e1b76f7cccace1cb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1801860309954068480 |