PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas

Detalhes bibliográficos
Autor(a) principal: Oliveira, Marcos Ricardo Santos
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFBA
Texto Completo: https://repositorio.ufba.br/handle/ri/36100
Resumo: O tratamento de informações ausentes ou inválidas em bases de dados representa um grande desafio na área de Aprendizado de Máquina (AM) que, se não for realizado da maneira adequada, pode afetar a qualidade do modelo produzido ou, até mesmo, impedir a sua utilização. Em geral, esse problema ocorre por diversas razões como, por exemplo, erro no dispositivo utilizado para coleta de informações, problemas na transmissão entre os dispositivos de coleta e de armazenamento, e a ausência real de informação no sistema monitorado. Quando os dados são coletados de maneira independente e identicamente distribuída, os próprios modelos tradicionais de AM podem ser utilizados para tratar esse problema. Entretanto, quando há dependência temporal entre as observações coletadas, e.g. quando os dados são organizados como séries temporais, tais modelos não são adequados por não considerar o relacionamento existente entre os instantes de tempo das coletas. Para o tratamento desse tipo de dado, há diversas técnicas como métodos de interpolação (e.g. Lagrange, Newton e Splines) e Singular Spectrum Analysis (SSA). Contudo, experimentos realizados durante este projeto de mestrado demonstraram que as técnicas existentes apresentam resultados insatisfatórios quando as séries temporais possuem comportamento caótico, uma vez que informações sobre seus atratores no espaço de coordenadas de atraso (espaço fase) não são levados em consideração. Neste sentido, este projeto de mestrado apresenta um novo método que utiliza ferramenta de Sistemas Dinâmicos e Teoria do Caos para desdobrar séries do domínio temporal para o espaço fase, viabilizando, assim, a aplicação de técnicas de Aprendizado de Máquina na substituição de valores ausentes. Resultados obtidos enfatizam a importância desse novo paradigma de substituição de valores ausentes, apresentando uma superioridade do método proposto com relação às técnicas conhecidas no estado da arte.
id UFBA-2_b3df77afc95ed3569d83cb12ad145423
oai_identifier_str oai:repositorio.ufba.br:ri/36100
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str 1932
spelling 2022-10-04T14:57:47Z2022-10-04T14:57:47Z2022-07-06OLIVEIRA, Marcos Ricardo Santos. PSGF (Phase Space Gap Filling): um novo método para substituição de valores ausentes em séries temporais caóticas. 2022. 83 f. Dissertação (Mestrado em Ciências da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, Ba, 2022.https://repositorio.ufba.br/handle/ri/36100O tratamento de informações ausentes ou inválidas em bases de dados representa um grande desafio na área de Aprendizado de Máquina (AM) que, se não for realizado da maneira adequada, pode afetar a qualidade do modelo produzido ou, até mesmo, impedir a sua utilização. Em geral, esse problema ocorre por diversas razões como, por exemplo, erro no dispositivo utilizado para coleta de informações, problemas na transmissão entre os dispositivos de coleta e de armazenamento, e a ausência real de informação no sistema monitorado. Quando os dados são coletados de maneira independente e identicamente distribuída, os próprios modelos tradicionais de AM podem ser utilizados para tratar esse problema. Entretanto, quando há dependência temporal entre as observações coletadas, e.g. quando os dados são organizados como séries temporais, tais modelos não são adequados por não considerar o relacionamento existente entre os instantes de tempo das coletas. Para o tratamento desse tipo de dado, há diversas técnicas como métodos de interpolação (e.g. Lagrange, Newton e Splines) e Singular Spectrum Analysis (SSA). Contudo, experimentos realizados durante este projeto de mestrado demonstraram que as técnicas existentes apresentam resultados insatisfatórios quando as séries temporais possuem comportamento caótico, uma vez que informações sobre seus atratores no espaço de coordenadas de atraso (espaço fase) não são levados em consideração. Neste sentido, este projeto de mestrado apresenta um novo método que utiliza ferramenta de Sistemas Dinâmicos e Teoria do Caos para desdobrar séries do domínio temporal para o espaço fase, viabilizando, assim, a aplicação de técnicas de Aprendizado de Máquina na substituição de valores ausentes. Resultados obtidos enfatizam a importância desse novo paradigma de substituição de valores ausentes, apresentando uma superioridade do método proposto com relação às técnicas conhecidas no estado da arte.The preprocessing step performed to deal with missing or invalid information in datasets is a relevant task in Machine Learning (ML) applications to avoid producing wrong models and make feasible the usage of specific algorithms that do not work in such a condition. In general, missing values occours for different reasons as, for instance, problems in the device used to monitor a system, network issues between monitoring and storage services, and the authentic absence of data. By collecting data in an i.i.d (independent and identically distributed) manner, traditional ML models are able to replace missing values. However, when there are temporal dependencies between collected observations, e.g., time series, such models are unsuitable for not considering the existing relationship in time instants. The treatment of missing data in time series is performed by several techniques such as interpolation methods (e.g. Lagrange, Newton, and Splines) and Singular Spectrum Analysis (SSA). Experiments during this project highlighted that these methods provided poor results when the time series present a chaotic behavior once their attractors in the phase space are not taken into account. Therefore, this work presents a new method that considers Dynamical System and Chaos Theory tools to unfold series from the temporal domain into phase space, making it possible the adoption of ML models to replace missing values. Our results emphasize the importance of this new paradigm to deal with missing values, outperforming the state-of-the-art.Submitted by Marcos Oliveira (ricardo.oliveira545@gmail.com) on 2022-09-21T16:31:56Z No. of bitstreams: 1 Dissertacao - Marcos Oliveira.pdf: 3798038 bytes, checksum: 4567b931200c6e3048c7064aaf28edd2 (MD5)Approved for entry into archive by Solange Rocha (soluny@gmail.com) on 2022-10-04T14:57:47Z (GMT) No. of bitstreams: 1 Dissertacao - Marcos Oliveira.pdf: 3798038 bytes, checksum: 4567b931200c6e3048c7064aaf28edd2 (MD5)Made available in DSpace on 2022-10-04T14:57:47Z (GMT). No. of bitstreams: 1 Dissertacao - Marcos Oliveira.pdf: 3798038 bytes, checksum: 4567b931200c6e3048c7064aaf28edd2 (MD5) Previous issue date: 2022-07-06porUniversidade Federal da BahiaPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) UFBABrasilInstituto de Computação - ICMissing value imputationChaotic time seriesMachine learningCNPQ::CIENCIAS EXATAS E DA TERRASubstituição de dados ausentesSéries temporais caóticasAprendizado de máquinaPSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticasPSGF (phase space gap filling): a new gap filling method for chaotic time seriesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisRios, Ricardo Araújo0000-0003-1449-4745http://lattes.cnpq.br/0427387583450747Rios, Ricardo Araújo0000-0003-1449-4745http://lattes.cnpq.br/0427387583450747Ishii, Renato Porfirio0000-0003-0825-8420http://lattes.cnpq.br/8992362063539452Santana, Ewaldo Eder Carvalho0000-0002-8894-5353http://lattes.cnpq.br/0660692009750374http://lattes.cnpq.br/0324710830372167Oliveira, Marcos Ricardo Santosreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAinfo:eu-repo/semantics/openAccessORIGINALDissertacao - Marcos Oliveira.pdfDissertacao - Marcos Oliveira.pdfDissertação de Marcos Oliveiraapplication/pdf3798038https://repositorio.ufba.br/bitstream/ri/36100/1/Dissertacao%20-%20Marcos%20Oliveira.pdf4567b931200c6e3048c7064aaf28edd2MD51LICENSElicense.txtlicense.txttext/plain1715https://repositorio.ufba.br/bitstream/ri/36100/2/license.txt67bf4f75790b0d8d38d8f112a48ad90bMD52TEXTDissertacao - Marcos Oliveira.pdf.txtDissertacao - Marcos Oliveira.pdf.txtExtracted texttext/plain189612https://repositorio.ufba.br/bitstream/ri/36100/3/Dissertacao%20-%20Marcos%20Oliveira.pdf.txteee39ebfd3666188d8b36d7c0d91ef31MD53ri/361002022-10-05 14:07:19.626oai:repositorio.ufba.br:ri/36100TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIG5vIGZvcm1hdG8gaW1wcmVzc28gZS9vdSBlbGV0csO0bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyAKZm9ybWF0b3Mgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gZS9vdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLCBwb2RlbmRvIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKTyBhdXRvciBvdSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IG5vIGNvbnRlw7pkbyBkYSBwdWJsaWNhw6fDo28gb3JhIGRlcG9zaXRhZGEuCgpDQVNPIEEgUFVCTElDQcOHw4NPIE9SQSBERVBPU0lUQURBICBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSAgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08sIENPTU8gVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIApFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28gZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322022-10-05T17:07:19Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
dc.title.alternative.pt_BR.fl_str_mv PSGF (phase space gap filling): a new gap filling method for chaotic time series
title PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
spellingShingle PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
Oliveira, Marcos Ricardo Santos
CNPQ::CIENCIAS EXATAS E DA TERRA
Substituição de dados ausentes
Séries temporais caóticas
Aprendizado de máquina
Missing value imputation
Chaotic time series
Machine learning
title_short PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
title_full PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
title_fullStr PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
title_full_unstemmed PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
title_sort PSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticas
author Oliveira, Marcos Ricardo Santos
author_facet Oliveira, Marcos Ricardo Santos
author_role author
dc.contributor.advisor1.fl_str_mv Rios, Ricardo Araújo
dc.contributor.advisor1ID.fl_str_mv 0000-0003-1449-4745
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0427387583450747
dc.contributor.referee1.fl_str_mv Rios, Ricardo Araújo
dc.contributor.referee1ID.fl_str_mv 0000-0003-1449-4745
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/0427387583450747
dc.contributor.referee2.fl_str_mv Ishii, Renato Porfirio
dc.contributor.referee2ID.fl_str_mv 0000-0003-0825-8420
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/8992362063539452
dc.contributor.referee3.fl_str_mv Santana, Ewaldo Eder Carvalho
dc.contributor.referee3ID.fl_str_mv 0000-0002-8894-5353
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/0660692009750374
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0324710830372167
dc.contributor.author.fl_str_mv Oliveira, Marcos Ricardo Santos
contributor_str_mv Rios, Ricardo Araújo
Rios, Ricardo Araújo
Ishii, Renato Porfirio
Santana, Ewaldo Eder Carvalho
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
topic CNPQ::CIENCIAS EXATAS E DA TERRA
Substituição de dados ausentes
Séries temporais caóticas
Aprendizado de máquina
Missing value imputation
Chaotic time series
Machine learning
dc.subject.por.fl_str_mv Substituição de dados ausentes
Séries temporais caóticas
Aprendizado de máquina
dc.subject.other.pt_BR.fl_str_mv Missing value imputation
Chaotic time series
Machine learning
description O tratamento de informações ausentes ou inválidas em bases de dados representa um grande desafio na área de Aprendizado de Máquina (AM) que, se não for realizado da maneira adequada, pode afetar a qualidade do modelo produzido ou, até mesmo, impedir a sua utilização. Em geral, esse problema ocorre por diversas razões como, por exemplo, erro no dispositivo utilizado para coleta de informações, problemas na transmissão entre os dispositivos de coleta e de armazenamento, e a ausência real de informação no sistema monitorado. Quando os dados são coletados de maneira independente e identicamente distribuída, os próprios modelos tradicionais de AM podem ser utilizados para tratar esse problema. Entretanto, quando há dependência temporal entre as observações coletadas, e.g. quando os dados são organizados como séries temporais, tais modelos não são adequados por não considerar o relacionamento existente entre os instantes de tempo das coletas. Para o tratamento desse tipo de dado, há diversas técnicas como métodos de interpolação (e.g. Lagrange, Newton e Splines) e Singular Spectrum Analysis (SSA). Contudo, experimentos realizados durante este projeto de mestrado demonstraram que as técnicas existentes apresentam resultados insatisfatórios quando as séries temporais possuem comportamento caótico, uma vez que informações sobre seus atratores no espaço de coordenadas de atraso (espaço fase) não são levados em consideração. Neste sentido, este projeto de mestrado apresenta um novo método que utiliza ferramenta de Sistemas Dinâmicos e Teoria do Caos para desdobrar séries do domínio temporal para o espaço fase, viabilizando, assim, a aplicação de técnicas de Aprendizado de Máquina na substituição de valores ausentes. Resultados obtidos enfatizam a importância desse novo paradigma de substituição de valores ausentes, apresentando uma superioridade do método proposto com relação às técnicas conhecidas no estado da arte.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-10-04T14:57:47Z
dc.date.available.fl_str_mv 2022-10-04T14:57:47Z
dc.date.issued.fl_str_mv 2022-07-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Marcos Ricardo Santos. PSGF (Phase Space Gap Filling): um novo método para substituição de valores ausentes em séries temporais caóticas. 2022. 83 f. Dissertação (Mestrado em Ciências da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, Ba, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufba.br/handle/ri/36100
identifier_str_mv OLIVEIRA, Marcos Ricardo Santos. PSGF (Phase Space Gap Filling): um novo método para substituição de valores ausentes em séries temporais caóticas. 2022. 83 f. Dissertação (Mestrado em Ciências da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, Ba, 2022.
url https://repositorio.ufba.br/handle/ri/36100
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Bahia
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação (PGCOMP) 
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Computação - IC
publisher.none.fl_str_mv Universidade Federal da Bahia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/36100/1/Dissertacao%20-%20Marcos%20Oliveira.pdf
https://repositorio.ufba.br/bitstream/ri/36100/2/license.txt
https://repositorio.ufba.br/bitstream/ri/36100/3/Dissertacao%20-%20Marcos%20Oliveira.pdf.txt
bitstream.checksum.fl_str_mv 4567b931200c6e3048c7064aaf28edd2
67bf4f75790b0d8d38d8f112a48ad90b
eee39ebfd3666188d8b36d7c0d91ef31
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv
_version_ 1808459652337238016