Teste para verificação da hipótese de ruído branco utilizando teoria da informação
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
Texto Completo: | http://www.repositorio.ufal.br/handle/riufal/2311 |
Resumo: | We want to verify if sequences of observations are white noise in the plane (H £C). In the literature, we find several works that do this in an “ad hoc” way, checking if the characteristic point of a sequence in that plane is close to the point (1,0). However, as Bandt (2017) states, we do not found detailed analyzes to assign statistical significance to such statements. To elucidate this question, and in the face of the impossibility of counting infinitely long sequences that are guaranteed to be white noise, we gather candidate sequences from three different sources: two physical and one algorithmic considered as a good source. We checked, if we may consider them ideals for our purposes. We analyze the dispersion of the characteristic points of these sequences in the plane (H £C) using four factors: the size of the sequence (N), the size of the word (D), the delay (¿) and the generating source, observing the distance from the characteristic points to the reference point. We observe that the generating source would be an irrelevant factor to the analyses. To verify this hipothesis, we applied the Kolmogorov-Smirnov test to pairs of comparable sequences, however we verify that only two sources are equivalents, the both physical. Therefore, we grouped the data from physical sources, and it became our groundtruth, then in sequence, we searched for trust regions. We adopted a non-parametric approach because we did not have no theoretical evidence about the distribution that follows the distance from the characteristic point to our groundtruth when a finite sequence of white noise candidate is analyzed. We then calculated the quantiles, respecting the factors sequence size (N), size of the word (D) and delay (¿), which serve as confidence regions for the test that gave rise to this work. We conclude the dissertation by verifying that sequences produced by community accepted generators generate characteristic points within confidence regions, while a generator that has been discarded by the structures that its sequences present leads to points outside these regions. We also applied the test to stationary and nonstationary sequences and, for the former, we make a preliminary assessment of the test power. |
id |
UFAL_247d51808b9366afe054529f666aa3e4 |
---|---|
oai_identifier_str |
oai:www.repositorio.ufal.br:riufal/2311 |
network_acronym_str |
UFAL |
network_name_str |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
repository_id_str |
|
spelling |
Teste para verificação da hipótese de ruído branco utilizando teoria da informaçãoTest for verification of the white noise hypothesis using information theoryTeoria da InformaçãoGeradores de números aleatóriosProcessamento de dados - Testes teóricosMatemática computacional – Testes estatísticosRandom number generatorsTheoretical testsInformation theoryStatistical testsCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOWe want to verify if sequences of observations are white noise in the plane (H £C). In the literature, we find several works that do this in an “ad hoc” way, checking if the characteristic point of a sequence in that plane is close to the point (1,0). However, as Bandt (2017) states, we do not found detailed analyzes to assign statistical significance to such statements. To elucidate this question, and in the face of the impossibility of counting infinitely long sequences that are guaranteed to be white noise, we gather candidate sequences from three different sources: two physical and one algorithmic considered as a good source. We checked, if we may consider them ideals for our purposes. We analyze the dispersion of the characteristic points of these sequences in the plane (H £C) using four factors: the size of the sequence (N), the size of the word (D), the delay (¿) and the generating source, observing the distance from the characteristic points to the reference point. We observe that the generating source would be an irrelevant factor to the analyses. To verify this hipothesis, we applied the Kolmogorov-Smirnov test to pairs of comparable sequences, however we verify that only two sources are equivalents, the both physical. Therefore, we grouped the data from physical sources, and it became our groundtruth, then in sequence, we searched for trust regions. We adopted a non-parametric approach because we did not have no theoretical evidence about the distribution that follows the distance from the characteristic point to our groundtruth when a finite sequence of white noise candidate is analyzed. We then calculated the quantiles, respecting the factors sequence size (N), size of the word (D) and delay (¿), which serve as confidence regions for the test that gave rise to this work. We conclude the dissertation by verifying that sequences produced by community accepted generators generate characteristic points within confidence regions, while a generator that has been discarded by the structures that its sequences present leads to points outside these regions. We also applied the test to stationary and nonstationary sequences and, for the former, we make a preliminary assessment of the test power.O nosso ponto de partida é o desejo de analisar se é viável verificar no plano (H £C), dentro de uma abordagem estatística, se sequências de observações são ruído branco. Na literatura encontramos diversos trabalhos que fazem isso de forma “ad hoc”, verificando se o ponto característico de uma sequência nesse plano é próximo ao ponto (1,0). Contudo, tal como afirma Bandt (2017), não encontramos análises detalhadas que permitam atribuir significância estatística a tais afirmações. Para elucidar essa questão, e diante da impossibilidade de contar com sequências infinitamente longas e que garantidamente sejam ruído branco, coletamos sequências de três fontes diferentes: duas físicas e uma algorítmica considerada de qualidade. Verificamos se é possível considerá-las ideais para os nossos fins. Analisamos a dispersão dos pontos característicos dessas sequências no plano (H £C) utilizando quatro fatores: o tamanho da sequência (N), o tamanho da palavra (D), o delay (¿) e a fonte geradora, observando a distância dos pontos característicos ao ponto de referência. Sugiram então evidências de que a fonte geradora seria umfator irrelevante para a análise. Com o intuito de consolidar essa possibilidade, aplicamos o teste de Kolmogorov-Smirnov a pares de sequências comparáveis, porém verificamos que apenas duas das fontes geradoras são realmente irrelevantes, as duas fontes físicas. Agrupamos, então os dados das fontes físicas e passamos a tratá-los como nossa referência, em seguida procuramos por regiões de confiança. Adotamos uma abordagem não-paramétrica por não termos nenhuma evidência teórica acerca da distribuição que segue a distância do ponto característico ao de referência quando é analisada uma sequência finita de ruído branco. Calculamos então os quantis, respeitados os fatores tamanho da sequência (N), tamanho da palavra (D) e delay (¿), que servem como regiões de confiança para o teste que deu origem a este trabalho. Concluímos a dissertação verificando que sequências produzidas por geradores aceitos pela comunidade geram pontos característicos dentro de regiões de confiança, enquanto que umgerador que foi descartado pelas estruturas que as suas sequências apresentam leva a pontos fora dessas mesmas regiões. Analisamos também sequências estacionárias e não estacionárias, e para as primeiras fazemos uma análise preliminar do poder do teste.Universidade Federal de AlagoasBrasilPrograma de Pós-Graduação em Modelagem Computacional de ConhecimentoUFALOrgambide, Alejandro Cesar Freryhttp://lattes.cnpq.br/6935433850568144Ramos Filho, Heitor Soareshttp://lattes.cnpq.br/4978869867640619Rosso, Osvaldo Anibalhttp://lattes.cnpq.br/2583233573401291Gambini, JulianaOliveira, Marcelo Queiroz de Assis2018-01-17T17:58:47Z2017-11-272018-01-17T17:58:47Z2017-11-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfOLIVEIRA, Marcelo Queiroz de Assis. Teste para Verificação da hipótese de ruído branco utilizando teoria da informação. 2017. 50 f. Dissertação (Mestrado em Modelagem Computacional de Conhecimento) - Instituto de Computação, Programa de Pós-Graduação em Modelagem Computacional, Universidade Federal de Alagoas, Maceió, 2017.http://www.repositorio.ufal.br/handle/riufal/2311porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL)instname:Universidade Federal de Alagoas (UFAL)instacron:UFAL2019-01-09T21:23:27Zoai:www.repositorio.ufal.br:riufal/2311Repositório InstitucionalPUBhttp://www.repositorio.ufal.br/oai/requestri@sibi.ufal.bropendoar:2019-01-09T21:23:27Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL)false |
dc.title.none.fl_str_mv |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação Test for verification of the white noise hypothesis using information theory |
title |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação |
spellingShingle |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação Oliveira, Marcelo Queiroz de Assis Teoria da Informação Geradores de números aleatórios Processamento de dados - Testes teóricos Matemática computacional – Testes estatísticos Random number generators Theoretical tests Information theory Statistical tests CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação |
title_full |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação |
title_fullStr |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação |
title_full_unstemmed |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação |
title_sort |
Teste para verificação da hipótese de ruído branco utilizando teoria da informação |
author |
Oliveira, Marcelo Queiroz de Assis |
author_facet |
Oliveira, Marcelo Queiroz de Assis |
author_role |
author |
dc.contributor.none.fl_str_mv |
Orgambide, Alejandro Cesar Frery http://lattes.cnpq.br/6935433850568144 Ramos Filho, Heitor Soares http://lattes.cnpq.br/4978869867640619 Rosso, Osvaldo Anibal http://lattes.cnpq.br/2583233573401291 Gambini, Juliana |
dc.contributor.author.fl_str_mv |
Oliveira, Marcelo Queiroz de Assis |
dc.subject.por.fl_str_mv |
Teoria da Informação Geradores de números aleatórios Processamento de dados - Testes teóricos Matemática computacional – Testes estatísticos Random number generators Theoretical tests Information theory Statistical tests CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Teoria da Informação Geradores de números aleatórios Processamento de dados - Testes teóricos Matemática computacional – Testes estatísticos Random number generators Theoretical tests Information theory Statistical tests CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
We want to verify if sequences of observations are white noise in the plane (H £C). In the literature, we find several works that do this in an “ad hoc” way, checking if the characteristic point of a sequence in that plane is close to the point (1,0). However, as Bandt (2017) states, we do not found detailed analyzes to assign statistical significance to such statements. To elucidate this question, and in the face of the impossibility of counting infinitely long sequences that are guaranteed to be white noise, we gather candidate sequences from three different sources: two physical and one algorithmic considered as a good source. We checked, if we may consider them ideals for our purposes. We analyze the dispersion of the characteristic points of these sequences in the plane (H £C) using four factors: the size of the sequence (N), the size of the word (D), the delay (¿) and the generating source, observing the distance from the characteristic points to the reference point. We observe that the generating source would be an irrelevant factor to the analyses. To verify this hipothesis, we applied the Kolmogorov-Smirnov test to pairs of comparable sequences, however we verify that only two sources are equivalents, the both physical. Therefore, we grouped the data from physical sources, and it became our groundtruth, then in sequence, we searched for trust regions. We adopted a non-parametric approach because we did not have no theoretical evidence about the distribution that follows the distance from the characteristic point to our groundtruth when a finite sequence of white noise candidate is analyzed. We then calculated the quantiles, respecting the factors sequence size (N), size of the word (D) and delay (¿), which serve as confidence regions for the test that gave rise to this work. We conclude the dissertation by verifying that sequences produced by community accepted generators generate characteristic points within confidence regions, while a generator that has been discarded by the structures that its sequences present leads to points outside these regions. We also applied the test to stationary and nonstationary sequences and, for the former, we make a preliminary assessment of the test power. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-11-27 2017-11-09 2018-01-17T17:58:47Z 2018-01-17T17:58:47Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
OLIVEIRA, Marcelo Queiroz de Assis. Teste para Verificação da hipótese de ruído branco utilizando teoria da informação. 2017. 50 f. Dissertação (Mestrado em Modelagem Computacional de Conhecimento) - Instituto de Computação, Programa de Pós-Graduação em Modelagem Computacional, Universidade Federal de Alagoas, Maceió, 2017. http://www.repositorio.ufal.br/handle/riufal/2311 |
identifier_str_mv |
OLIVEIRA, Marcelo Queiroz de Assis. Teste para Verificação da hipótese de ruído branco utilizando teoria da informação. 2017. 50 f. Dissertação (Mestrado em Modelagem Computacional de Conhecimento) - Instituto de Computação, Programa de Pós-Graduação em Modelagem Computacional, Universidade Federal de Alagoas, Maceió, 2017. |
url |
http://www.repositorio.ufal.br/handle/riufal/2311 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Alagoas Brasil Programa de Pós-Graduação em Modelagem Computacional de Conhecimento UFAL |
publisher.none.fl_str_mv |
Universidade Federal de Alagoas Brasil Programa de Pós-Graduação em Modelagem Computacional de Conhecimento UFAL |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal de Alagoas (UFAL) instname:Universidade Federal de Alagoas (UFAL) instacron:UFAL |
instname_str |
Universidade Federal de Alagoas (UFAL) |
instacron_str |
UFAL |
institution |
UFAL |
reponame_str |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
collection |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal de Alagoas (UFAL) - Universidade Federal de Alagoas (UFAL) |
repository.mail.fl_str_mv |
ri@sibi.ufal.br |
_version_ |
1748233745870094336 |