Métrica para múltiplos processos estocásticos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1641971 |
Resumo: | Orientadores: Verónica Andrea González-López, Jesus Enrique Garcia |
id |
UNICAMP-30_6bd4ecdee991896f17e207e5330103db |
---|---|
oai_identifier_str |
oai::1166697 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Métrica para múltiplos processos estocásticosMetric for multiple stochastic processesProcesso estocásticoMétrica (Matemática)Processos de MarkovSequências estocásticasPartições (Matemática)Stochastic processesMetric (Mathematics)Markov processesStochastic sequencesPartitions (Mathematics)Orientadores: Verónica Andrea González-López, Jesus Enrique GarciaTese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação CientíficaResumo: Nesta tese, aplicamos a métrica ds e noções correlatas (propostas em (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a) e (FERNÁNDEZ et al., 2019)), derivadas a partir do BIC. Usamos tais noções para classificar realizações de processos estocásticos Markovianos, definidos num mesmo alfabeto A e possuindo uma ordem o e espaço de estados S Ao (o, |A|, |S| 8), doravante apenas chamados de cadeias de Markov (CM). O processo de construção e algumas propriedades de ds (e noções correlatas) são descritos. Assim, ordenamos, em relação a sua representatividade quanto às leis de formação, sequências de DNA provenientes de dados genômicos do vírus da Dengue tipo 1 (CORDEIRO et al., 2019a) e do vírus da Zika (GARCÍA et al., 2018), sendo que tais sequências foram tratadas como realizações de CM com alfabeto A ta, c, g, tu e o 3. Portanto, apontamos em cada caso qual sequência poderia ser usada como um "padrão-ouro" do conjunto das sequências, podendo esta ser usada em comparações com outras sequências de modo a, por exemplo, detectar novas cepas do vírus. No entanto, este procedimento tem por característica ignorar, a informação contida nas sequências não escolhidas. De modo a preencher esta lacuna, desenvolvemos uma extensão da métrica ds (proposta em (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a)). Para tal é proposta uma nova noção (vide (CORDEIRO et al., 2020)) definida num conjunto M t1, ..., pu Ao, onde t1, ..., pu é um conjunto de indexadores para cada uma das p realizações independentes de CM disponíveis. Na modelagem particionamos o conjunto M usando uma relação de equivalência e, mostramos como esta métrica pode ser utilizada na obtenção do Modelo de Markov de Partições (MMP), proposto em (CORDEIRO et al., 2020). Na sequência, mostramos também algumas das propriedades teóricas da métrica, dentre elas: (i) a prova de que ela é, de fato uma métrica e, portanto, M um espaço métrico (ii) a consistência estatística da métrica na estimação do MMP (CORDEIRO et al., 2020). Adiante, trouxemos duas aplicações da métrica na obtenção de MMP, para coleções de dados genômicos dos vírus Epstein-Bar (CORDEIRO et al., 2019b) e da Zika (CORDEIRO et al., 2020). Em ambas as aplicações, um modelo único que descreve de forma parcimoniosa, a lei de formação de todas as sequências, foi obtido. Como na primeira situação, este modelo único poderia ser comparado a outras sequências não utilizadas na estimação do modelo e, assim, identificar possíveis novas cepas do vírus sob investigaçãoAbstract: In this thesis, we apply the ds metric and related notions (proposed in (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a) and (FERNÁNDEZ et al., 2019)), derived from the BIC. We use these notions to classify realizations of Markovian stochastic processes, defined in the same alphabet A and having an order o and state space S Ao (o, |A|, |S| 8), hereinafter referred to as Markov chains (CM). The construction process and some properties of ds (and related notions) are described. Thus, we ordered, in relation to their representativeness regarding the formation laws, DNA sequences from genomic data of the Dengue virus type 1 (CORDEIRO et al., 2019a) and the Zika virus (GARCÍA et al., 2018), and such sequences were treated as CM realizations with alphabet A ta, c, g, tu and o 3. Therefore, we indicate in each case which sequence could be used as a "gold standard" of the set of sequences, which can be used in comparisons with other sequences in order, for example, to detect new strains of the virus. However, this procedure has the characteristic of ignoring, the information contained in the non-chosen sequences. In order to fill this gap, we developed an extension of the ds metric (proposed in (GARCÍA; GHOLIZADEH; GONZÁLEZ-LÓPEZ, 2018a)). To this end, a new notion is proposed (see (CORDEIRO et al., 2020)) defined in a set M t1, ..., pu Ao, where t1, ..., pu is a set of indexers for each of the available p independent CM realizations. In the modeling we partition the set M using an equivalence relation and, we show how this metric can be used to obtain the Partition Markov Model (MMP), proposed in (CORDEIRO et al., 2020). In the sequence, we also show some of the theoretical properties of the metric, among them: (i) the proof that it is, in fact, a metric and, therefore, M a metric space (ii) the statistical consistency of the metric in the estimation of the MMP (CORDEIRO et al., 2020). Lastly, we brought two applications of the metric in obtaining MMP, for collections of genomic data of the Epstein-Bar (CORDEIRO et al., 2019b) and Zika (CORDEIRO et al., 2020) viruses. In both applications, a unique model that sparingly describes the law of formation of all sequences was obtained. As in the first situation, this unique model could be compared to other sequences not used in the estimation of the model and, thus, to identify possible new strains of the virus under investigationDoutoradoEstatísticaDoutor em EstatísticaCAPES0[s.n.]González-López, Verónica Andrea, 1970-Garcia, Jesus Enrique, 1966-Matos, Larissa AvilaReisen, Valderio AnselmoViola, Márcio Luis LanfrediUniversidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação CientíficaPrograma de Pós-Graduação em EstatísticaUNIVERSIDADE ESTADUAL DE CAMPINASCordeiro, Marcos Tadeu Andrade, 1986-20212021-05-24T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf1 recurso online (144 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1641971CORDEIRO, Marcos Tadeu Andrade. Métrica para múltiplos processos estocásticos. 2021. 1 recurso online (144 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641971. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1166697Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-10-22T14:45:12Zoai::1166697Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-10-22T14:45:12Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Métrica para múltiplos processos estocásticos Metric for multiple stochastic processes |
title |
Métrica para múltiplos processos estocásticos |
spellingShingle |
Métrica para múltiplos processos estocásticos Cordeiro, Marcos Tadeu Andrade, 1986- Processo estocástico Métrica (Matemática) Processos de Markov Sequências estocásticas Partições (Matemática) Stochastic processes Metric (Mathematics) Markov processes Stochastic sequences Partitions (Mathematics) |
title_short |
Métrica para múltiplos processos estocásticos |
title_full |
Métrica para múltiplos processos estocásticos |
title_fullStr |
Métrica para múltiplos processos estocásticos |
title_full_unstemmed |
Métrica para múltiplos processos estocásticos |
title_sort |
Métrica para múltiplos processos estocásticos |
author |
Cordeiro, Marcos Tadeu Andrade, 1986- |
author_facet |
Cordeiro, Marcos Tadeu Andrade, 1986- |
author_role |
author |
dc.contributor.none.fl_str_mv |
González-López, Verónica Andrea, 1970- Garcia, Jesus Enrique, 1966- Matos, Larissa Avila Reisen, Valderio Anselmo Viola, Márcio Luis Lanfredi Universidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação Científica Programa de Pós-Graduação em Estatística UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Cordeiro, Marcos Tadeu Andrade, 1986- |
dc.subject.por.fl_str_mv |
Processo estocástico Métrica (Matemática) Processos de Markov Sequências estocásticas Partições (Matemática) Stochastic processes Metric (Mathematics) Markov processes Stochastic sequences Partitions (Mathematics) |
topic |
Processo estocástico Métrica (Matemática) Processos de Markov Sequências estocásticas Partições (Matemática) Stochastic processes Metric (Mathematics) Markov processes Stochastic sequences Partitions (Mathematics) |
description |
Orientadores: Verónica Andrea González-López, Jesus Enrique Garcia |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2021-05-24T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1641971 CORDEIRO, Marcos Tadeu Andrade. Métrica para múltiplos processos estocásticos. 2021. 1 recurso online (144 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641971. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1641971 |
identifier_str_mv |
CORDEIRO, Marcos Tadeu Andrade. Métrica para múltiplos processos estocásticos. 2021. 1 recurso online (144 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641971. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1166697 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (144 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189175944019968 |