Sparse precision matrix estimation in phylogenetic trait evolution models
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/239263 |
Resumo: | Os modelos filogenéticos para evolução de traços (fenotípicos) permitem a estimativa de correlações evolutivas entre um conjunto de traços observados numa amostra de organismos relacionados. Ao modelar diretamente a evolução dos traços numa árvore filogenética num contexto Bayesiano, a estrutura do modelo nos permite controlar para a história evolutiva compartilhada entre os organismos da amostra e evitar as inferências espúrias originadas pelo parentesco. Nestes modelos, as correlações relevantes são definidas por meio do intervalo de credibilidade das correlações marginais. No entanto, as correlações selecionadas por si só podem não fornecer a melhor informação sobre as relações entre as características em estudo. A sua estrutura de associação, em contraste, fornece uma informação clara sobre associações diretas entre os traços em estudo. A fim de empregar um método baseado em modelo para identificar a estrutura de associação subjacente entre as variáveis, exploramos a utilização de modelos Gaussianos com grafos (GGM) para a seleção das covariâncias. Modelamos a matriz de precisão com a distribuição G-Wishart, uma priori conjugada que resulta em estimativas de precisão esparsa. Avaliamos a nossa abordagem através de simulações de Monte Carlo e comparamos os resultados com o método padrão, onde nenhuma estrutura de associação é explicitamente modelada. Também testamos a nossa abordagem para examinar a estrutura de associação e correlações evolutivas em dois conjuntods de dados: um envolvendo traços fenotípicos dos tentilhões de Darwin e outro envolvendo traços genômicos e fenotípicos de procariotos. A nossa abordagem fornece uma solução sistemática para a eliminação de correlações espúrias e melhor inferência para as matrizes de precisão e correlação, especialmente para as variáveis condicionalmente independentes, que são o alvo da esparsidade nos GGMs. Combinar a inferência das correlações evolutivas e da estrutura de associação permite uma seleção mais precisa das características que potencialmente interagiram ou interagem ao longo do processo evolutivo dos organismos estudados. |
id |
URGS_d0db3074b3ae0d19116ed66e31d0658f |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/239263 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Pinheiro, Felipe GrilloCybis, Gabriela BettellaPrass, Taiane Schaedler2022-05-25T04:42:07Z2022http://hdl.handle.net/10183/239263001141067Os modelos filogenéticos para evolução de traços (fenotípicos) permitem a estimativa de correlações evolutivas entre um conjunto de traços observados numa amostra de organismos relacionados. Ao modelar diretamente a evolução dos traços numa árvore filogenética num contexto Bayesiano, a estrutura do modelo nos permite controlar para a história evolutiva compartilhada entre os organismos da amostra e evitar as inferências espúrias originadas pelo parentesco. Nestes modelos, as correlações relevantes são definidas por meio do intervalo de credibilidade das correlações marginais. No entanto, as correlações selecionadas por si só podem não fornecer a melhor informação sobre as relações entre as características em estudo. A sua estrutura de associação, em contraste, fornece uma informação clara sobre associações diretas entre os traços em estudo. A fim de empregar um método baseado em modelo para identificar a estrutura de associação subjacente entre as variáveis, exploramos a utilização de modelos Gaussianos com grafos (GGM) para a seleção das covariâncias. Modelamos a matriz de precisão com a distribuição G-Wishart, uma priori conjugada que resulta em estimativas de precisão esparsa. Avaliamos a nossa abordagem através de simulações de Monte Carlo e comparamos os resultados com o método padrão, onde nenhuma estrutura de associação é explicitamente modelada. Também testamos a nossa abordagem para examinar a estrutura de associação e correlações evolutivas em dois conjuntods de dados: um envolvendo traços fenotípicos dos tentilhões de Darwin e outro envolvendo traços genômicos e fenotípicos de procariotos. A nossa abordagem fornece uma solução sistemática para a eliminação de correlações espúrias e melhor inferência para as matrizes de precisão e correlação, especialmente para as variáveis condicionalmente independentes, que são o alvo da esparsidade nos GGMs. Combinar a inferência das correlações evolutivas e da estrutura de associação permite uma seleção mais precisa das características que potencialmente interagiram ou interagem ao longo do processo evolutivo dos organismos estudados.Phylogenetic trait evolution models allow for the estimation of evolutionary correlations between a set of traits observed in a sample of related organisms. By directly modeling the evolution of the traits on a phylogenetic tree in a Bayesian framework, the model’s structure allows us to control for shared evolutionary history between the organisms in the sample and avoid spurious inference that could have been originated from common ancestors. In these models, relevant correlations are obtained through the high posterior density interval of marginal correlations. However, the selected correlations alone may not provide the best information regarding trait relationships. Their association structure, in contrast, provide straightforward information about direct associations. In order to employ a model based method to identify the underlying association structure between the variables we explore the use of Gaussian graphical models (GGM) for covariance selection. We model the precision matrix with a G-Wishart conjugate prior which results in sparse precision estimates. We evaluate our approach through Monte Carlo simulations and compare the results to the standard method, where no association structure is explicitly modeled. We also test our approach to examine the association structure and evolutionary correlations of Darwin’s finches phenotypic traits and prokaryotic genomic and phenotypic traits. Our approach provides a systematic solution for elimination of spurious correlations and better inference for the precision and correlation matrices, especially for conditionally independent variables, which are the target for sparsity in GGMs. Combining correlation and association structure inference allows for a more precise selection of candidate traits that may interact along the evolutionary process of related organisms.application/pdfporInferência bayesianaFilogenéticaFenótipoBayesian inferenceTrait evolution modelGaussian graphical modelsPhylogeneticsSparse precision matrix estimation in phylogenetic trait evolution modelsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de Matemática e EstatísticaPrograma de Pós-Graduação em EstatísticaPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001141067.pdf.txt001141067.pdf.txtExtracted Texttext/plain130754http://www.lume.ufrgs.br/bitstream/10183/239263/2/001141067.pdf.txt5a9c175cbff551d5f364b06d5ca6367dMD52ORIGINAL001141067.pdfTexto completo (inglês)application/pdf5115160http://www.lume.ufrgs.br/bitstream/10183/239263/1/001141067.pdf0b5b273ec902e073548d09d8279e7a95MD5110183/2392632022-05-26 04:38:55.074074oai:www.lume.ufrgs.br:10183/239263Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-05-26T07:38:55Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Sparse precision matrix estimation in phylogenetic trait evolution models |
title |
Sparse precision matrix estimation in phylogenetic trait evolution models |
spellingShingle |
Sparse precision matrix estimation in phylogenetic trait evolution models Pinheiro, Felipe Grillo Inferência bayesiana Filogenética Fenótipo Bayesian inference Trait evolution model Gaussian graphical models Phylogenetics |
title_short |
Sparse precision matrix estimation in phylogenetic trait evolution models |
title_full |
Sparse precision matrix estimation in phylogenetic trait evolution models |
title_fullStr |
Sparse precision matrix estimation in phylogenetic trait evolution models |
title_full_unstemmed |
Sparse precision matrix estimation in phylogenetic trait evolution models |
title_sort |
Sparse precision matrix estimation in phylogenetic trait evolution models |
author |
Pinheiro, Felipe Grillo |
author_facet |
Pinheiro, Felipe Grillo |
author_role |
author |
dc.contributor.author.fl_str_mv |
Pinheiro, Felipe Grillo |
dc.contributor.advisor1.fl_str_mv |
Cybis, Gabriela Bettella |
dc.contributor.advisor-co1.fl_str_mv |
Prass, Taiane Schaedler |
contributor_str_mv |
Cybis, Gabriela Bettella Prass, Taiane Schaedler |
dc.subject.por.fl_str_mv |
Inferência bayesiana Filogenética Fenótipo |
topic |
Inferência bayesiana Filogenética Fenótipo Bayesian inference Trait evolution model Gaussian graphical models Phylogenetics |
dc.subject.eng.fl_str_mv |
Bayesian inference Trait evolution model Gaussian graphical models Phylogenetics |
description |
Os modelos filogenéticos para evolução de traços (fenotípicos) permitem a estimativa de correlações evolutivas entre um conjunto de traços observados numa amostra de organismos relacionados. Ao modelar diretamente a evolução dos traços numa árvore filogenética num contexto Bayesiano, a estrutura do modelo nos permite controlar para a história evolutiva compartilhada entre os organismos da amostra e evitar as inferências espúrias originadas pelo parentesco. Nestes modelos, as correlações relevantes são definidas por meio do intervalo de credibilidade das correlações marginais. No entanto, as correlações selecionadas por si só podem não fornecer a melhor informação sobre as relações entre as características em estudo. A sua estrutura de associação, em contraste, fornece uma informação clara sobre associações diretas entre os traços em estudo. A fim de empregar um método baseado em modelo para identificar a estrutura de associação subjacente entre as variáveis, exploramos a utilização de modelos Gaussianos com grafos (GGM) para a seleção das covariâncias. Modelamos a matriz de precisão com a distribuição G-Wishart, uma priori conjugada que resulta em estimativas de precisão esparsa. Avaliamos a nossa abordagem através de simulações de Monte Carlo e comparamos os resultados com o método padrão, onde nenhuma estrutura de associação é explicitamente modelada. Também testamos a nossa abordagem para examinar a estrutura de associação e correlações evolutivas em dois conjuntods de dados: um envolvendo traços fenotípicos dos tentilhões de Darwin e outro envolvendo traços genômicos e fenotípicos de procariotos. A nossa abordagem fornece uma solução sistemática para a eliminação de correlações espúrias e melhor inferência para as matrizes de precisão e correlação, especialmente para as variáveis condicionalmente independentes, que são o alvo da esparsidade nos GGMs. Combinar a inferência das correlações evolutivas e da estrutura de associação permite uma seleção mais precisa das características que potencialmente interagiram ou interagem ao longo do processo evolutivo dos organismos estudados. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-05-25T04:42:07Z |
dc.date.issued.fl_str_mv |
2022 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/239263 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001141067 |
url |
http://hdl.handle.net/10183/239263 |
identifier_str_mv |
001141067 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/239263/2/001141067.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/239263/1/001141067.pdf |
bitstream.checksum.fl_str_mv |
5a9c175cbff551d5f364b06d5ca6367d 0b5b273ec902e073548d09d8279e7a95 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085585524621312 |