Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFLA |
Texto Completo: | http://repositorio.ufla.br/jspui/handle/1/49422 |
Resumo: | There are many methods for genomic selection that address the problems of multicollinearity and high dimensionality, among which the rr-BLUP and Bayes B stand out in the literature. Methods of continuous genome and functional regression in chromosomal windows (bins) were recently proposed to better utilize the linkage disequilibrium between SNP (Single Nucleotide Polymorphism) and potential QTLs (Quantitative Trait Loci). One of the proposed strategies is to use polynomial or trigonometric functions in bins-fitted versions. In this case, a complicating factor is the potential misspecification of the number and the sizes of the bins, with a potential increase in the prediction error. In this thesys we investigate the advantages of making inference in the joint posterior distribution for the number, the size and the effects of marks in bins in a reversible jump sampling process. This type of technique was difficult to implement for previous models that took into account the distance between marks and QTLs, but it can be greatly simplified in simple regression models typical of modern genomics (where each SNP potentially segregates as a QTL). We study the two strategies and their immediate consequences for genomic selection. A basic review of the literature methods was used to subsidize two original papers. In the first one, we evaluated the implementation of functional models of bins using Fourier series and B- Splines. In the second, we introduce the RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) for functional models in which each bin is represented in the sampling by only one of its marks. The models considered were comparable to the most used for prediction (Bayes-B, rr-BLUP) and are suitable for genomic selection. As a potential by-product of the thesys, the results for association studies are also interesting, despite not being our main goal to evaluate them. |
id |
UFLA_d287c0e967633b8fad794c2c21b1265e |
---|---|
oai_identifier_str |
oai:localhost:1/49422 |
network_acronym_str |
UFLA |
network_name_str |
Repositório Institucional da UFLA |
repository_id_str |
|
spelling |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveisGenomic analysis through chromosomal windows: functional regression and reversible jumpsB-SplinesModelos funcionaisSéries de FourierMarkov Chain Monte CarloFunctional modelsFourier seriesEstatísticaThere are many methods for genomic selection that address the problems of multicollinearity and high dimensionality, among which the rr-BLUP and Bayes B stand out in the literature. Methods of continuous genome and functional regression in chromosomal windows (bins) were recently proposed to better utilize the linkage disequilibrium between SNP (Single Nucleotide Polymorphism) and potential QTLs (Quantitative Trait Loci). One of the proposed strategies is to use polynomial or trigonometric functions in bins-fitted versions. In this case, a complicating factor is the potential misspecification of the number and the sizes of the bins, with a potential increase in the prediction error. In this thesys we investigate the advantages of making inference in the joint posterior distribution for the number, the size and the effects of marks in bins in a reversible jump sampling process. This type of technique was difficult to implement for previous models that took into account the distance between marks and QTLs, but it can be greatly simplified in simple regression models typical of modern genomics (where each SNP potentially segregates as a QTL). We study the two strategies and their immediate consequences for genomic selection. A basic review of the literature methods was used to subsidize two original papers. In the first one, we evaluated the implementation of functional models of bins using Fourier series and B- Splines. In the second, we introduce the RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) for functional models in which each bin is represented in the sampling by only one of its marks. The models considered were comparable to the most used for prediction (Bayes-B, rr-BLUP) and are suitable for genomic selection. As a potential by-product of the thesys, the results for association studies are also interesting, despite not being our main goal to evaluate them.Há muitos métodos para a seleção genômica que tratam dos problemas da multicolinearidade e da alta dimensionalidade, dentre os quais destacam-se na literatura o rr-BLUP e o Bayes B. Métodos de genoma contínuo e regressão funcional em janelas cromossômicas (bins) foram recentemente propostas para melhor utilizar o desequilíbrio de ligação entre SNP (Single Nucleotide Polymorphism) e potenciais QTLs (Quantitative Trait Loci). Uma das estratégias propostas é utilizar funções polinomiais ou trigonométricas em versões ajustadas para janelas cromossômicas (bins). Nesse caso, um fator complicador é a potencial má especificação do número e tamanho dos bins, com potencial ampliação do erro de predição. Neste trabalho nós investigamos as vantagens de fazer a inferência conjunta a posteriori do número, do tamanho e dos efeitos das marcas nos bins em um processo de amostragem por saltos reversíveis. Este tipo de técnica era de difícil implementação para modelos anteriores que levavam em conta a distância entre marcas e QTLs, mas pode ser muito simplificado em modelos de regressão simples típicos da genômica moderna (em que cada SNP segrega potencialmente como um QTL). Estudamos as duas estratégias e suas consequências imediatas para a seleção genômica. Uma revisão de literatura inicial sobre os métodos foi feita como subsídio para dois artigos. No primeiro, avaliamos a implementação de modelos funcionais de bins com o uso de séries de Fourier e de B-Splines. No segundo, introduzimos o RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) para modelos funcionais em que cada bin é representado na amostragem por uma só de suas marcas. Os modelos considerados foram comparáveis aos métodos mais utilizados quanto à predição (Bayes-B, rr- BLUP) e são adequados para a seleção genômica. Como potencial subproduto do da tese, os resultados para estudos de associação são também interessantes, embora não tenha sido nosso objetivo principal avaliá-los.Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilDepartamento de EstatísticaBalestre, MárcioBueno Filho, Júlio Silvio de SousaSilva, Carlos Pereira daSilva, Carlos Pereira daGarcia, Antônio Augusto FrancoPamplona, Andrezza Kellen AlvesSarmento, José Lindenberg RochaMoura, Ernandes Guedes2022-02-24T20:31:29Z2022-02-24T20:31:29Z2022-02-242021-02-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfMOURA, E. G. Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis. 2021. 93 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) – Universidade Federal de Lavras, Lavras, 2022.http://repositorio.ufla.br/jspui/handle/1/49422porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2023-05-11T15:47:45Zoai:localhost:1/49422Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2023-05-11T15:47:45Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false |
dc.title.none.fl_str_mv |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis Genomic analysis through chromosomal windows: functional regression and reversible jumps |
title |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis |
spellingShingle |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis Moura, Ernandes Guedes B-Splines Modelos funcionais Séries de Fourier Markov Chain Monte Carlo Functional models Fourier series Estatística |
title_short |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis |
title_full |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis |
title_fullStr |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis |
title_full_unstemmed |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis |
title_sort |
Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis |
author |
Moura, Ernandes Guedes |
author_facet |
Moura, Ernandes Guedes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Balestre, Márcio Bueno Filho, Júlio Silvio de Sousa Silva, Carlos Pereira da Silva, Carlos Pereira da Garcia, Antônio Augusto Franco Pamplona, Andrezza Kellen Alves Sarmento, José Lindenberg Rocha |
dc.contributor.author.fl_str_mv |
Moura, Ernandes Guedes |
dc.subject.por.fl_str_mv |
B-Splines Modelos funcionais Séries de Fourier Markov Chain Monte Carlo Functional models Fourier series Estatística |
topic |
B-Splines Modelos funcionais Séries de Fourier Markov Chain Monte Carlo Functional models Fourier series Estatística |
description |
There are many methods for genomic selection that address the problems of multicollinearity and high dimensionality, among which the rr-BLUP and Bayes B stand out in the literature. Methods of continuous genome and functional regression in chromosomal windows (bins) were recently proposed to better utilize the linkage disequilibrium between SNP (Single Nucleotide Polymorphism) and potential QTLs (Quantitative Trait Loci). One of the proposed strategies is to use polynomial or trigonometric functions in bins-fitted versions. In this case, a complicating factor is the potential misspecification of the number and the sizes of the bins, with a potential increase in the prediction error. In this thesys we investigate the advantages of making inference in the joint posterior distribution for the number, the size and the effects of marks in bins in a reversible jump sampling process. This type of technique was difficult to implement for previous models that took into account the distance between marks and QTLs, but it can be greatly simplified in simple regression models typical of modern genomics (where each SNP potentially segregates as a QTL). We study the two strategies and their immediate consequences for genomic selection. A basic review of the literature methods was used to subsidize two original papers. In the first one, we evaluated the implementation of functional models of bins using Fourier series and B- Splines. In the second, we introduce the RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) for functional models in which each bin is represented in the sampling by only one of its marks. The models considered were comparable to the most used for prediction (Bayes-B, rr-BLUP) and are suitable for genomic selection. As a potential by-product of the thesys, the results for association studies are also interesting, despite not being our main goal to evaluate them. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-02-26 2022-02-24T20:31:29Z 2022-02-24T20:31:29Z 2022-02-24 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MOURA, E. G. Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis. 2021. 93 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) – Universidade Federal de Lavras, Lavras, 2022. http://repositorio.ufla.br/jspui/handle/1/49422 |
identifier_str_mv |
MOURA, E. G. Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis. 2021. 93 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) – Universidade Federal de Lavras, Lavras, 2022. |
url |
http://repositorio.ufla.br/jspui/handle/1/49422 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Lavras Programa de Pós-Graduação em Estatística e Experimentação Agropecuária UFLA brasil Departamento de Estatística |
publisher.none.fl_str_mv |
Universidade Federal de Lavras Programa de Pós-Graduação em Estatística e Experimentação Agropecuária UFLA brasil Departamento de Estatística |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
instname_str |
Universidade Federal de Lavras (UFLA) |
instacron_str |
UFLA |
institution |
UFLA |
reponame_str |
Repositório Institucional da UFLA |
collection |
Repositório Institucional da UFLA |
repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
_version_ |
1815439228056633344 |