Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos

Detalhes bibliográficos
Autor(a) principal: Alves, Rosiana Rodrigues
Data de Publicação: 2014
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFLA
Texto Completo: http://repositorio.ufla.br/jspui/handle/1/4630
Resumo: Tese apresentada à Universidade Federal de La-vras, como parte das exigências do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Doutor.
id UFLA_29038028923181e4069b1f552d6febbe
oai_identifier_str oai:localhost:1/4630
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótiposRegresão linear múltiplaLasso bayesianoBayesian LassoTournament screeningCNPQ_NÃO_INFORMADOTese apresentada à Universidade Federal de La-vras, como parte das exigências do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Doutor.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Estatística e Experimentação AgropecuáriaUma grande dificuldade em analisar dados de seleção genômica é que o número de preditores (marcadores SNPs) é muito maior que o número de animais avaliados. O número de correlações espúrias que surgem por mero acaso entre segregações de marcadores e fenótipos cresce exponencialmente. Uma nova série de abordagens têm sido propostas para solucionar o problema (n << p). O lasso bayesiano é uma opção estabelecida na literatura e métodos de seleção por torneios são sugestões recentes. Estes procedimentos consistem em dividir os SNP’s em grupos aleatórios e fazer um “torneio” entre os efeitos estimados. Cada grupo é analisado em separado com algum modelo de regressão. Em nosso caso, eliminava-se o SNP como menor efeito. Os marcadores selecionados são então reunidos e entram na próxima fase em que são divididas em grupos por sorteio. Este processo é continuado até o numero de variáveis seja reduzido ao desejado. Neste trabalho, em um estudo de simulação ajustou-se torneios usando a regressão múltipla e o lasso bayesiano. As análises foram comparadas ao lasso bayesiano sem a utilização de torneios (com todas as marcas). As metodologias propostas foram aplicadas em um conjunto de dados de 384 bovinos da raça Canchim genotipados usando o BovineHD BeadChip com 708.641 SNP’s identificados. Note-se que no estudo simulação foi utilizada a matriz de genótipos real e simulando os efeitos genéticos do SNP’s e o vetor de fenótipos considerando três herdabilidades (25%, 50% e 100%). Para cada herdabilidade analisou-se torneios com três tamanhos de grupos (25, 50 e 100). A validação cruzada foi feita usando 1/8 das observações. Os resultados encontrados no torneios e no lasso bayesiano mostram que esses métodos não são muito diferentes em simulação. Para os dados reais a validação cruzada também foi equivalente. É preciso notar que os torneios permitem a paralelização direta da análise. Com o equipamento usado, torneios com regressão múltipla foram 10 vezes mais rápidos que o laso bayesiano. Os torneios são metodologias simples e rápidas com eficiência equiparável ao lasso bayesiano.A major difficulty in analyzing genomic selection data is that the number of predictor (SNP markers) is much larger than the number of evaluated animals. The spurious correlations that arises by chance in joint segregation of SNPs and phenotypes grows exponentialy. A new series of methods have been proposed to tackle this question (n << p). Bayesian Lasso and its variations are established in the literature and tournament screening is among the new suggestions. The idea is to divide SNPs in randomly assembled groups and make a “tournament” of estimated effects. Each group is analysed separately with a regression model. In our case, SNPs with saller effects were out. Remaining markers are pooled and new phase of random groups were generated. The process goes on until the remaining SNPs are as few as desired. In this work, in a simulation study, multiple regression and Bayesian lasso models were adjusted within groups. Analyses were then compared to Bayesian lasso with all markers (no tournaments). Proposed methods were applied to 384 bovine (Canchim breed animals) genotyped using the BovineHD Bead-Chip with 708;641 SNPs identified. Was also performed a simulation study using the real genotypes matrix and, simulating the genetical effects of SNPs and the vector of phenotypes, these, considering the following heritability estimates: 25%, 50% and 100%. For each heritability were analysed tournaments containing three sizes of groups: 25, 50 and 100. An 8-fold cross-validation was carried out. According to results from simulation, the tournaments and Bayesian lasso do not differ much. For real data, cross validation results are also equivalent. Note that tournaments allow for direct parallelization of analyses. With the used hardware tournaments with multiple regression were 10-fold faster than Bayesian lasso. Tournaments are simple and fast methods that yield equivalent results to Bayesian lasso.UNIVERSIDADE FEDERAL DE LAVRASDEX - Programa de Pós-graduaçãoUFLABRASILBueno Filho, Julio Silvio SousaBalestre, MarcioFerreira, Daniel FurtadoSilva, Maria Imaculada de SousaLeandro, Roseli AparecidaAlves, Rosiana Rodrigues2014-11-12T14:12:04Z2014-11-12T14:12:04Z20142014-02-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfALVES, R. R. Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos. 2014. 70 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2014.http://repositorio.ufla.br/jspui/handle/1/4630info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLA2021-11-05T15:19:41Zoai:localhost:1/4630Repositório InstitucionalPUBhttp://repositorio.ufla.br/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2021-11-05T15:19:41Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)false
dc.title.none.fl_str_mv Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
title Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
spellingShingle Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
Alves, Rosiana Rodrigues
Regresão linear múltipla
Lasso bayesiano
Bayesian Lasso
Tournament screening
CNPQ_NÃO_INFORMADO
title_short Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
title_full Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
title_fullStr Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
title_full_unstemmed Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
title_sort Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
author Alves, Rosiana Rodrigues
author_facet Alves, Rosiana Rodrigues
author_role author
dc.contributor.none.fl_str_mv Bueno Filho, Julio Silvio Sousa
Balestre, Marcio
Ferreira, Daniel Furtado
Silva, Maria Imaculada de Sousa
Leandro, Roseli Aparecida
dc.contributor.author.fl_str_mv Alves, Rosiana Rodrigues
dc.subject.por.fl_str_mv Regresão linear múltipla
Lasso bayesiano
Bayesian Lasso
Tournament screening
CNPQ_NÃO_INFORMADO
topic Regresão linear múltipla
Lasso bayesiano
Bayesian Lasso
Tournament screening
CNPQ_NÃO_INFORMADO
description Tese apresentada à Universidade Federal de La-vras, como parte das exigências do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Doutor.
publishDate 2014
dc.date.none.fl_str_mv 2014-11-12T14:12:04Z
2014-11-12T14:12:04Z
2014
2014-02-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALVES, R. R. Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos. 2014. 70 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2014.
http://repositorio.ufla.br/jspui/handle/1/4630
identifier_str_mv ALVES, R. R. Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos. 2014. 70 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2014.
url http://repositorio.ufla.br/jspui/handle/1/4630
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
DEX - Programa de Pós-graduação
UFLA
BRASIL
publisher.none.fl_str_mv UNIVERSIDADE FEDERAL DE LAVRAS
DEX - Programa de Pós-graduação
UFLA
BRASIL
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1784550033621778432