Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos

Detalhes bibliográficos
Autor(a) principal: Joaquim, Letícia Borges [UNESP]
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/191351
Resumo: A seleção genômica tem sido usada em vários programas de melhoramento de plantas e animais proporcionando ganhos na acurácia de seleção quando comparado a seleção tradicional. Contudo, é importante ressaltar que a superioridade da seleção genômica depende de vários fatores tais como a metodologia de predição dos valores genéticos genômicos. Além do desafio de encontrar a melhor metodologia para a aplicação da seleção genômica, o alto custo de implementação também representa uma dificuldade na sua ampla utilização nos programas de melhoramento animal, principalmente em suínos e aves. Os objetivos deste trabalho foram: (i) avaliar a capacidade de predição de quatro diferentes métodos de seleção genômica para características reprodutivas e produtivas; (ii) utilizar o método “Random Forest” para selecionar conjuntos de marcadores SNPs mais relevantes na explicação dos fenótipos para as características estudadas e verificar o impacto do uso desses conjuntos de SNPs na acurácia dos valores genômicos preditos para duas características de importância econômica na suinocultura. No estudo foi utilizado um arquivo de pedigree com 879.965 animais distribuídos em 13 gerações e um arquivo de fenótipos composto por 73.439 observações de espessura de gordura (EG) e 69.505 registros de número de leitões nascidos vivos por leitegada (NV). Além disso, informações de 969 animais de uma linhagem fêmea tipo Landrace genotipados com um painel customizado com 57.692 marcadores distribuídos por todo o genoma foram utilizadas. A seleção genômica foi realizada aplicando os métodos lineares GBLUP – “Genomic Estimated Breeding Value” e “Single-step” GBLUP e os não lineares brnn - “Bayesian Regularized Neural Network” e snnR – “Sparse Neural Networks”. Para verificar o impacto do uso de conjuntos de SNPs na habilidade de predição da seleção genômica foram avaliados 5 cenários: 1 - 3.000 SNPs mais importantes para EG; 2 - 3.000 SNPs mais importantes para NV; 3- 3.000 SNPs mais importantes para as duas características em conjunto; 4 - 3.000 SNPs selecionados aleatoriamente; e 5 - todos os SNPs. O método “Random Forest” foi utilizado para seleção dos SNPs dos três primeiros cenários e os valores genéticos genômicos foram preditos utilizando o método “Single-step” GBLUP. No estudo das metodologias de seleção genômica verificou-se que as acurácias de predições foram melhores para a característica EG em relação a característica NV. Também se observou que o método que apresentou a melhor predição dos valores genéticos genômicos na população estudada para ambas as características foi “single-step” GBLUP quando comparado ao método GBLUP e os métodos de redes neurais snnR e brnn. Na avaliação da predição dos valores genéticos genômicos utilizando conjuntos de SNPs identificados com o método de aprendizagem de máquina, demonstrou-se que esse método pode ser utilizado para selecionar eficientemente conjuntos de marcadores para formarem painéis de genotipagem de baixa densidade e assim reduzir os custos da implementação da seleção genômica. Isto porque, o conjunto de marcadores selecionados com o mesmo apresentou habilidade de predição semelhante quando comparado a habilidade de predição com a informação de todos os SNPs na seleção genômica apenas para a característica número de leitões nascidos vivos.
id UNSP_9c41b4bac601999be3ac22aaf2acc68c
oai_identifier_str oai:repositorio.unesp.br:11449/191351
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínosParametric and non-parametric methods for the prediction of genetic values of economically important traits in pigsBrnnEspessura de gorduraNúmero de leitões nascidos vivos“Random Forest”SnnRA seleção genômica tem sido usada em vários programas de melhoramento de plantas e animais proporcionando ganhos na acurácia de seleção quando comparado a seleção tradicional. Contudo, é importante ressaltar que a superioridade da seleção genômica depende de vários fatores tais como a metodologia de predição dos valores genéticos genômicos. Além do desafio de encontrar a melhor metodologia para a aplicação da seleção genômica, o alto custo de implementação também representa uma dificuldade na sua ampla utilização nos programas de melhoramento animal, principalmente em suínos e aves. Os objetivos deste trabalho foram: (i) avaliar a capacidade de predição de quatro diferentes métodos de seleção genômica para características reprodutivas e produtivas; (ii) utilizar o método “Random Forest” para selecionar conjuntos de marcadores SNPs mais relevantes na explicação dos fenótipos para as características estudadas e verificar o impacto do uso desses conjuntos de SNPs na acurácia dos valores genômicos preditos para duas características de importância econômica na suinocultura. No estudo foi utilizado um arquivo de pedigree com 879.965 animais distribuídos em 13 gerações e um arquivo de fenótipos composto por 73.439 observações de espessura de gordura (EG) e 69.505 registros de número de leitões nascidos vivos por leitegada (NV). Além disso, informações de 969 animais de uma linhagem fêmea tipo Landrace genotipados com um painel customizado com 57.692 marcadores distribuídos por todo o genoma foram utilizadas. A seleção genômica foi realizada aplicando os métodos lineares GBLUP – “Genomic Estimated Breeding Value” e “Single-step” GBLUP e os não lineares brnn - “Bayesian Regularized Neural Network” e snnR – “Sparse Neural Networks”. Para verificar o impacto do uso de conjuntos de SNPs na habilidade de predição da seleção genômica foram avaliados 5 cenários: 1 - 3.000 SNPs mais importantes para EG; 2 - 3.000 SNPs mais importantes para NV; 3- 3.000 SNPs mais importantes para as duas características em conjunto; 4 - 3.000 SNPs selecionados aleatoriamente; e 5 - todos os SNPs. O método “Random Forest” foi utilizado para seleção dos SNPs dos três primeiros cenários e os valores genéticos genômicos foram preditos utilizando o método “Single-step” GBLUP. No estudo das metodologias de seleção genômica verificou-se que as acurácias de predições foram melhores para a característica EG em relação a característica NV. Também se observou que o método que apresentou a melhor predição dos valores genéticos genômicos na população estudada para ambas as características foi “single-step” GBLUP quando comparado ao método GBLUP e os métodos de redes neurais snnR e brnn. Na avaliação da predição dos valores genéticos genômicos utilizando conjuntos de SNPs identificados com o método de aprendizagem de máquina, demonstrou-se que esse método pode ser utilizado para selecionar eficientemente conjuntos de marcadores para formarem painéis de genotipagem de baixa densidade e assim reduzir os custos da implementação da seleção genômica. Isto porque, o conjunto de marcadores selecionados com o mesmo apresentou habilidade de predição semelhante quando comparado a habilidade de predição com a informação de todos os SNPs na seleção genômica apenas para a característica número de leitões nascidos vivos.Genomic selection has been used in several plant and animal breeding programs providing selection accuracy gains when compared to traditional genetic analysis. However, it is important to emphasize the superiority of genomic selection depends on several factors, such as the methodology for predicting genomic values. In addition to the challenge of finding the best model for application of genomic selection, the high cost of implementation also makes difficult the use of genomic selection in breeding programs of all animal species. Therefore, the aims of this study were: (i) evaluate the prediction ability of four different genomic selection methods using reproductive and productive traits; (ii) use Random Forest analysis to select the most important markers for studied traits and to verify the impact of using these subsets of SNPs on the accuracy of predicted genomic values for two economically important traits in pig production. The pedigree files contained 879,965 individuals, which spanned up to 13 generations and phenotype file composed of 73,439 backfat thickness observations and 69,505 litter records. A total of 969 animals of a Landrace female line were genotyped using a custom Illumina chip consisting of 57,692 SNPs distributed throughout the genome. Genomic selection was performed by applying the linear methods GBLUP (Genomic Estimated Breeding Value) and Single-step GBLUP and the nonlinear methods brnn (Bayesian Regularized Neural Network) and snnR (“Sparse Neural Networks). The prediction capacity of each method was tested by Pearson correlation, mean square measure error and the regression coefficient. To verify the impact of the use of SNP sets on the prediction accuracy of genomic selection, 5 scenarios were evaluated: 1 - 3,000 most important SNPs for backfat thickness; 2 - 3,000 most important SNPs to born alive piglets; 3 - 3,000 most important SNPs for both traits together; 4 - 3,000 randomly selected SNPs; and 5 all SNPs. The Random Forest method was used to select SNPs from the first three scenarios and genomic selection was performed using the GBLUP single-step method. In the study of genomic selection methodologies, it was found that the prediction accuracy was better for the backfat thickness trait in relation to the number of piglets born alive. The results also show that the method that presented the best prediction of genomic genetic values in the population studied for the backfat thickness and number of piglets born alive was single-step GBLUP when compared to GBLUP and neural network methods snnR and brnn. In assessing the prediction of genomic genetic values using subsets of SNP selected with the machine learning method, it has been shown that the Random Forest method can be used to efficiently select subset marker to form low density genotyping panels and thus reduce the costs of implementing genomic selection. This is because the set of markers selected from using machine learning method presented similar prediction ability when compared the prediction ability with the information of all SNPs in the genomic selection for the trait number of born alive piglets.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Estadual Paulista (Unesp)Munari, Danísio Prado [UNESP]Universidade Estadual Paulista (Unesp)Joaquim, Letícia Borges [UNESP]2020-01-14T19:21:24Z2020-01-14T19:21:24Z2019-11-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/11449/19135100092832033004102030P4porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-06-05T18:32:21Zoai:repositorio.unesp.br:11449/191351Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T16:50:29.908763Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
Parametric and non-parametric methods for the prediction of genetic values of economically important traits in pigs
title Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
spellingShingle Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
Joaquim, Letícia Borges [UNESP]
Brnn
Espessura de gordura
Número de leitões nascidos vivos
“Random Forest”
SnnR
title_short Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
title_full Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
title_fullStr Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
title_full_unstemmed Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
title_sort Métodos paramétricos e não paramétricos para a predição de valores genéticos genômicos de características de importância econômica em suínos
author Joaquim, Letícia Borges [UNESP]
author_facet Joaquim, Letícia Borges [UNESP]
author_role author
dc.contributor.none.fl_str_mv Munari, Danísio Prado [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Joaquim, Letícia Borges [UNESP]
dc.subject.por.fl_str_mv Brnn
Espessura de gordura
Número de leitões nascidos vivos
“Random Forest”
SnnR
topic Brnn
Espessura de gordura
Número de leitões nascidos vivos
“Random Forest”
SnnR
description A seleção genômica tem sido usada em vários programas de melhoramento de plantas e animais proporcionando ganhos na acurácia de seleção quando comparado a seleção tradicional. Contudo, é importante ressaltar que a superioridade da seleção genômica depende de vários fatores tais como a metodologia de predição dos valores genéticos genômicos. Além do desafio de encontrar a melhor metodologia para a aplicação da seleção genômica, o alto custo de implementação também representa uma dificuldade na sua ampla utilização nos programas de melhoramento animal, principalmente em suínos e aves. Os objetivos deste trabalho foram: (i) avaliar a capacidade de predição de quatro diferentes métodos de seleção genômica para características reprodutivas e produtivas; (ii) utilizar o método “Random Forest” para selecionar conjuntos de marcadores SNPs mais relevantes na explicação dos fenótipos para as características estudadas e verificar o impacto do uso desses conjuntos de SNPs na acurácia dos valores genômicos preditos para duas características de importância econômica na suinocultura. No estudo foi utilizado um arquivo de pedigree com 879.965 animais distribuídos em 13 gerações e um arquivo de fenótipos composto por 73.439 observações de espessura de gordura (EG) e 69.505 registros de número de leitões nascidos vivos por leitegada (NV). Além disso, informações de 969 animais de uma linhagem fêmea tipo Landrace genotipados com um painel customizado com 57.692 marcadores distribuídos por todo o genoma foram utilizadas. A seleção genômica foi realizada aplicando os métodos lineares GBLUP – “Genomic Estimated Breeding Value” e “Single-step” GBLUP e os não lineares brnn - “Bayesian Regularized Neural Network” e snnR – “Sparse Neural Networks”. Para verificar o impacto do uso de conjuntos de SNPs na habilidade de predição da seleção genômica foram avaliados 5 cenários: 1 - 3.000 SNPs mais importantes para EG; 2 - 3.000 SNPs mais importantes para NV; 3- 3.000 SNPs mais importantes para as duas características em conjunto; 4 - 3.000 SNPs selecionados aleatoriamente; e 5 - todos os SNPs. O método “Random Forest” foi utilizado para seleção dos SNPs dos três primeiros cenários e os valores genéticos genômicos foram preditos utilizando o método “Single-step” GBLUP. No estudo das metodologias de seleção genômica verificou-se que as acurácias de predições foram melhores para a característica EG em relação a característica NV. Também se observou que o método que apresentou a melhor predição dos valores genéticos genômicos na população estudada para ambas as características foi “single-step” GBLUP quando comparado ao método GBLUP e os métodos de redes neurais snnR e brnn. Na avaliação da predição dos valores genéticos genômicos utilizando conjuntos de SNPs identificados com o método de aprendizagem de máquina, demonstrou-se que esse método pode ser utilizado para selecionar eficientemente conjuntos de marcadores para formarem painéis de genotipagem de baixa densidade e assim reduzir os custos da implementação da seleção genômica. Isto porque, o conjunto de marcadores selecionados com o mesmo apresentou habilidade de predição semelhante quando comparado a habilidade de predição com a informação de todos os SNPs na seleção genômica apenas para a característica número de leitões nascidos vivos.
publishDate 2019
dc.date.none.fl_str_mv 2019-11-29
2020-01-14T19:21:24Z
2020-01-14T19:21:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/191351
000928320
33004102030P4
url http://hdl.handle.net/11449/191351
identifier_str_mv 000928320
33004102030P4
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128708838424576