Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis

Detalhes bibliográficos
Autor(a) principal: Moura, Ernandes Guedes
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFLA
Texto Completo: http://repositorio.ufla.br/jspui/handle/1/49422
Resumo: There are many methods for genomic selection that address the problems of multicollinearity and high dimensionality, among which the rr-BLUP and Bayes B stand out in the literature. Methods of continuous genome and functional regression in chromosomal windows (bins) were recently proposed to better utilize the linkage disequilibrium between SNP (Single Nucleotide Polymorphism) and potential QTLs (Quantitative Trait Loci). One of the proposed strategies is to use polynomial or trigonometric functions in bins-fitted versions. In this case, a complicating factor is the potential misspecification of the number and the sizes of the bins, with a potential increase in the prediction error. In this thesys we investigate the advantages of making inference in the joint posterior distribution for the number, the size and the effects of marks in bins in a reversible jump sampling process. This type of technique was difficult to implement for previous models that took into account the distance between marks and QTLs, but it can be greatly simplified in simple regression models typical of modern genomics (where each SNP potentially segregates as a QTL). We study the two strategies and their immediate consequences for genomic selection. A basic review of the literature methods was used to subsidize two original papers. In the first one, we evaluated the implementation of functional models of bins using Fourier series and B- Splines. In the second, we introduce the RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) for functional models in which each bin is represented in the sampling by only one of its marks. The models considered were comparable to the most used for prediction (Bayes-B, rr-BLUP) and are suitable for genomic selection. As a potential by-product of the thesys, the results for association studies are also interesting, despite not being our main goal to evaluate them.
id UFLA_d287c0e967633b8fad794c2c21b1265e
oai_identifier_str oai:localhost:1/49422
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveisGenomic analysis through chromosomal windows: functional regression and reversible jumpsB-SplinesModelos funcionaisSéries de FourierMarkov Chain Monte CarloFunctional modelsFourier seriesEstatísticaThere are many methods for genomic selection that address the problems of multicollinearity and high dimensionality, among which the rr-BLUP and Bayes B stand out in the literature. Methods of continuous genome and functional regression in chromosomal windows (bins) were recently proposed to better utilize the linkage disequilibrium between SNP (Single Nucleotide Polymorphism) and potential QTLs (Quantitative Trait Loci). One of the proposed strategies is to use polynomial or trigonometric functions in bins-fitted versions. In this case, a complicating factor is the potential misspecification of the number and the sizes of the bins, with a potential increase in the prediction error. In this thesys we investigate the advantages of making inference in the joint posterior distribution for the number, the size and the effects of marks in bins in a reversible jump sampling process. This type of technique was difficult to implement for previous models that took into account the distance between marks and QTLs, but it can be greatly simplified in simple regression models typical of modern genomics (where each SNP potentially segregates as a QTL). We study the two strategies and their immediate consequences for genomic selection. A basic review of the literature methods was used to subsidize two original papers. In the first one, we evaluated the implementation of functional models of bins using Fourier series and B- Splines. In the second, we introduce the RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) for functional models in which each bin is represented in the sampling by only one of its marks. The models considered were comparable to the most used for prediction (Bayes-B, rr-BLUP) and are suitable for genomic selection. As a potential by-product of the thesys, the results for association studies are also interesting, despite not being our main goal to evaluate them.Há muitos métodos para a seleção genômica que tratam dos problemas da multicolinearidade e da alta dimensionalidade, dentre os quais destacam-se na literatura o rr-BLUP e o Bayes B. Métodos de genoma contínuo e regressão funcional em janelas cromossômicas (bins) foram recentemente propostas para melhor utilizar o desequilíbrio de ligação entre SNP (Single Nucleotide Polymorphism) e potenciais QTLs (Quantitative Trait Loci). Uma das estratégias propostas é utilizar funções polinomiais ou trigonométricas em versões ajustadas para janelas cromossômicas (bins). Nesse caso, um fator complicador é a potencial má especificação do número e tamanho dos bins, com potencial ampliação do erro de predição. Neste trabalho nós investigamos as vantagens de fazer a inferência conjunta a posteriori do número, do tamanho e dos efeitos das marcas nos bins em um processo de amostragem por saltos reversíveis. Este tipo de técnica era de difícil implementação para modelos anteriores que levavam em conta a distância entre marcas e QTLs, mas pode ser muito simplificado em modelos de regressão simples típicos da genômica moderna (em que cada SNP segrega potencialmente como um QTL). Estudamos as duas estratégias e suas consequências imediatas para a seleção genômica. Uma revisão de literatura inicial sobre os métodos foi feita como subsídio para dois artigos. No primeiro, avaliamos a implementação de modelos funcionais de bins com o uso de séries de Fourier e de B-Splines. No segundo, introduzimos o RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) para modelos funcionais em que cada bin é representado na amostragem por uma só de suas marcas. Os modelos considerados foram comparáveis aos métodos mais utilizados quanto à predição (Bayes-B, rr- BLUP) e são adequados para a seleção genômica. Como potencial subproduto do da tese, os resultados para estudos de associação são também interessantes, embora não tenha sido nosso objetivo principal avaliá-los.Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilDepartamento de EstatísticaBalestre, MárcioBueno Filho, Júlio Silvio de SousaSilva, Carlos Pereira daSilva, Carlos Pereira daGarcia, Antônio Augusto FrancoPamplona, Andrezza Kellen AlvesSarmento, José Lindenberg RochaMoura, Ernandes Guedes2022-02-24T20:31:29Z2022-02-24T20:31:29Z2022-02-242021-02-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfMOURA, E. G. Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis. 2021. 93 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) – Universidade Federal de Lavras, Lavras, 2022.http://repositorio.ufla.br/jspui/handle/1/49422porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2023-05-11T15:47:45Zoai:localhost:1/49422Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2023-05-11T15:47:45Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false
dc.title.none.fl_str_mv Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
Genomic analysis through chromosomal windows: functional regression and reversible jumps
title Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
spellingShingle Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
Moura, Ernandes Guedes
B-Splines
Modelos funcionais
Séries de Fourier
Markov Chain Monte Carlo
Functional models
Fourier series
Estatística
title_short Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
title_full Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
title_fullStr Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
title_full_unstemmed Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
title_sort Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis
author Moura, Ernandes Guedes
author_facet Moura, Ernandes Guedes
author_role author
dc.contributor.none.fl_str_mv Balestre, Márcio
Bueno Filho, Júlio Silvio de Sousa
Silva, Carlos Pereira da
Silva, Carlos Pereira da
Garcia, Antônio Augusto Franco
Pamplona, Andrezza Kellen Alves
Sarmento, José Lindenberg Rocha
dc.contributor.author.fl_str_mv Moura, Ernandes Guedes
dc.subject.por.fl_str_mv B-Splines
Modelos funcionais
Séries de Fourier
Markov Chain Monte Carlo
Functional models
Fourier series
Estatística
topic B-Splines
Modelos funcionais
Séries de Fourier
Markov Chain Monte Carlo
Functional models
Fourier series
Estatística
description There are many methods for genomic selection that address the problems of multicollinearity and high dimensionality, among which the rr-BLUP and Bayes B stand out in the literature. Methods of continuous genome and functional regression in chromosomal windows (bins) were recently proposed to better utilize the linkage disequilibrium between SNP (Single Nucleotide Polymorphism) and potential QTLs (Quantitative Trait Loci). One of the proposed strategies is to use polynomial or trigonometric functions in bins-fitted versions. In this case, a complicating factor is the potential misspecification of the number and the sizes of the bins, with a potential increase in the prediction error. In this thesys we investigate the advantages of making inference in the joint posterior distribution for the number, the size and the effects of marks in bins in a reversible jump sampling process. This type of technique was difficult to implement for previous models that took into account the distance between marks and QTLs, but it can be greatly simplified in simple regression models typical of modern genomics (where each SNP potentially segregates as a QTL). We study the two strategies and their immediate consequences for genomic selection. A basic review of the literature methods was used to subsidize two original papers. In the first one, we evaluated the implementation of functional models of bins using Fourier series and B- Splines. In the second, we introduce the RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) for functional models in which each bin is represented in the sampling by only one of its marks. The models considered were comparable to the most used for prediction (Bayes-B, rr-BLUP) and are suitable for genomic selection. As a potential by-product of the thesys, the results for association studies are also interesting, despite not being our main goal to evaluate them.
publishDate 2021
dc.date.none.fl_str_mv 2021-02-26
2022-02-24T20:31:29Z
2022-02-24T20:31:29Z
2022-02-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MOURA, E. G. Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis. 2021. 93 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) – Universidade Federal de Lavras, Lavras, 2022.
http://repositorio.ufla.br/jspui/handle/1/49422
identifier_str_mv MOURA, E. G. Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis. 2021. 93 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) – Universidade Federal de Lavras, Lavras, 2022.
url http://repositorio.ufla.br/jspui/handle/1/49422
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Lavras
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
UFLA
brasil
Departamento de Estatística
publisher.none.fl_str_mv Universidade Federal de Lavras
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
UFLA
brasil
Departamento de Estatística
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1815439228056633344