Métrica para múltiplos processos estocásticos

Detalhes bibliográficos
Autor(a) principal: Cordeiro, Marcos Tadeu Andrade, 1986-
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1641971
Resumo: Orientadores: Verónica Andrea González-López, Jesus Enrique Garcia
id UNICAMP-30_6bd4ecdee991896f17e207e5330103db
oai_identifier_str oai::1166697
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Métrica para múltiplos processos estocásticosMetric for multiple stochastic processesProcesso estocásticoMétrica (Matemática)Processos de MarkovSequências estocásticasPartições (Matemática)Stochastic processesMetric (Mathematics)Markov processesStochastic sequencesPartitions (Mathematics)Orientadores: Verónica Andrea González-López, Jesus Enrique GarciaTese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação CientíficaResumo: Nesta tese, aplicamos a métrica ds e noções correlatas (propostas em (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a) e (FERNÁNDEZ et al., 2019)), derivadas a partir do BIC. Usamos tais noções para classificar realizações de processos estocásticos Markovianos, definidos num mesmo alfabeto A e possuindo uma ordem o e espaço de estados S Ao (o, |A|, |S|   8), doravante apenas chamados de cadeias de Markov (CM). O processo de construção e algumas propriedades de ds (e noções correlatas) são descritos. Assim, ordenamos, em relação a sua representatividade quanto às leis de formação, sequências de DNA provenientes de dados genômicos do vírus da Dengue tipo 1 (CORDEIRO et al., 2019a) e do vírus da Zika (GARCÍA et al., 2018), sendo que tais sequências foram tratadas como realizações de CM com alfabeto A ta, c, g, tu e o 3. Portanto, apontamos em cada caso qual sequência poderia ser usada como um "padrão-ouro" do conjunto das sequências, podendo esta ser usada em comparações com outras sequências de modo a, por exemplo, detectar novas cepas do vírus. No entanto, este procedimento tem por característica ignorar, a informação contida nas sequências não escolhidas. De modo a preencher esta lacuna, desenvolvemos uma extensão da métrica ds (proposta em (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a)). Para tal é proposta uma nova noção (vide (CORDEIRO et al., 2020)) definida num conjunto M t1, ..., pu Ao, onde t1, ..., pu é um conjunto de indexadores para cada uma das p realizações independentes de CM disponíveis. Na modelagem particionamos o conjunto M usando uma relação de equivalência e, mostramos como esta métrica pode ser utilizada na obtenção do Modelo de Markov de Partições (MMP), proposto em (CORDEIRO et al., 2020). Na sequência, mostramos também algumas das propriedades teóricas da métrica, dentre elas: (i) a prova de que ela é, de fato uma métrica e, portanto, M um espaço métrico (ii) a consistência estatística da métrica na estimação do MMP (CORDEIRO et al., 2020). Adiante, trouxemos duas aplicações da métrica na obtenção de MMP, para coleções de dados genômicos dos vírus Epstein-Bar (CORDEIRO et al., 2019b) e da Zika (CORDEIRO et al., 2020). Em ambas as aplicações, um modelo único que descreve de forma parcimoniosa, a lei de formação de todas as sequências, foi obtido. Como na primeira situação, este modelo único poderia ser comparado a outras sequências não utilizadas na estimação do modelo e, assim, identificar possíveis novas cepas do vírus sob investigaçãoAbstract: In this thesis, we apply the ds metric and related notions (proposed in (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a) and (FERNÁNDEZ et al., 2019)), derived from the BIC. We use these notions to classify realizations of Markovian stochastic processes, defined in the same alphabet A and having an order o and state space S Ao (o, |A|, |S|   8), hereinafter referred to as Markov chains (CM). The construction process and some properties of ds (and related notions) are described. Thus, we ordered, in relation to their representativeness regarding the formation laws, DNA sequences from genomic data of the Dengue virus type 1 (CORDEIRO et al., 2019a) and the Zika virus (GARCÍA et al., 2018), and such sequences were treated as CM realizations with alphabet A ta, c, g, tu and o 3. Therefore, we indicate in each case which sequence could be used as a "gold standard" of the set of sequences, which can be used in comparisons with other sequences in order, for example, to detect new strains of the virus. However, this procedure has the characteristic of ignoring, the information contained in the non-chosen sequences. In order to fill this gap, we developed an extension of the ds metric (proposed in (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a)). To this end, a new notion is proposed (see (CORDEIRO et al., 2020)) defined in a set M t1, ..., pu Ao, where t1, ..., pu is a set of indexers for each of the available p independent CM realizations. In the modeling we partition the set M using an equivalence relation and, we show how this metric can be used to obtain the Partition Markov Model (MMP), proposed in (CORDEIRO et al., 2020). In the sequence, we also show some of the theoretical properties of the metric, among them: (i) the proof that it is, in fact, a metric and, therefore, M a metric space (ii) the statistical consistency of the metric in the estimation of the MMP (CORDEIRO et al., 2020). Lastly, we brought two applications of the metric in obtaining MMP, for collections of genomic data of the Epstein-Bar (CORDEIRO et al., 2019b) and Zika (CORDEIRO et al., 2020) viruses. In both applications, a unique model that sparingly describes the law of formation of all sequences was obtained. As in the first situation, this unique model could be compared to other sequences not used in the estimation of the model and, thus, to identify possible new strains of the virus under investigationDoutoradoEstatísticaDoutor em EstatísticaCAPES0[s.n.]González-López, Verónica Andrea, 1970-Garcia, Jesus Enrique, 1966-Matos, Larissa AvilaReisen, Valderio AnselmoViola, Márcio Luis LanfrediUniversidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação CientíficaPrograma de Pós-Graduação em EstatísticaUNIVERSIDADE ESTADUAL DE CAMPINASCordeiro, Marcos Tadeu Andrade, 1986-20212021-05-24T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online (144 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1641971CORDEIRO, Marcos Tadeu Andrade. Métrica para múltiplos processos estocásticos. 2021. 1 recurso online (144 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641971. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1166697Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-10-22T14:45:12Zoai::1166697Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-10-22T14:45:12Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Métrica para múltiplos processos estocásticos
Metric for multiple stochastic processes
title Métrica para múltiplos processos estocásticos
spellingShingle Métrica para múltiplos processos estocásticos
Cordeiro, Marcos Tadeu Andrade, 1986-
Processo estocástico
Métrica (Matemática)
Processos de Markov
Sequências estocásticas
Partições (Matemática)
Stochastic processes
Metric (Mathematics)
Markov processes
Stochastic sequences
Partitions (Mathematics)
title_short Métrica para múltiplos processos estocásticos
title_full Métrica para múltiplos processos estocásticos
title_fullStr Métrica para múltiplos processos estocásticos
title_full_unstemmed Métrica para múltiplos processos estocásticos
title_sort Métrica para múltiplos processos estocásticos
author Cordeiro, Marcos Tadeu Andrade, 1986-
author_facet Cordeiro, Marcos Tadeu Andrade, 1986-
author_role author
dc.contributor.none.fl_str_mv González-López, Verónica Andrea, 1970-
Garcia, Jesus Enrique, 1966-
Matos, Larissa Avila
Reisen, Valderio Anselmo
Viola, Márcio Luis Lanfredi
Universidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação Científica
Programa de Pós-Graduação em Estatística
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Cordeiro, Marcos Tadeu Andrade, 1986-
dc.subject.por.fl_str_mv Processo estocástico
Métrica (Matemática)
Processos de Markov
Sequências estocásticas
Partições (Matemática)
Stochastic processes
Metric (Mathematics)
Markov processes
Stochastic sequences
Partitions (Mathematics)
topic Processo estocástico
Métrica (Matemática)
Processos de Markov
Sequências estocásticas
Partições (Matemática)
Stochastic processes
Metric (Mathematics)
Markov processes
Stochastic sequences
Partitions (Mathematics)
description Orientadores: Verónica Andrea González-López, Jesus Enrique Garcia
publishDate 2021
dc.date.none.fl_str_mv 2021
2021-05-24T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1641971
CORDEIRO, Marcos Tadeu Andrade. Métrica para múltiplos processos estocásticos. 2021. 1 recurso online (144 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641971. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1641971
identifier_str_mv CORDEIRO, Marcos Tadeu Andrade. Métrica para múltiplos processos estocásticos. 2021. 1 recurso online (144 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641971. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1166697
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (144 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189175944019968