Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês

Detalhes bibliográficos
Autor(a) principal: Ladeira, Giovanni Coelho
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/11/11139/tde-11102021-124537/
Resumo: Variações no número de cópias (CNV) são variações estruturais no DNA de no mínimo 1 kb e que diferem do genoma referência quanto ao número de cópias. O crescente número de estudos com CNV reportam sua associação com doenças em humanos e diversas características quantitativas em animais domésticos. Entretanto, não foram reportados estudos de associação genômica ampla baseados em CNV em ovinos Santa Inês, uma das raças mais importantes do Brasil e, ademais, informações sobre a inclusão de efeitos de CNV em modelos de predição de GEBV são escassos. Assim, os objetivos do presente estudo foram 1) identificar e quantificar CNVs em uma população de ovinos da raça Santa Inês, 2) verificar possíveis associações entre CNVs e características de interesse, 3) identificar possível sobreposição de segmentos de CNVs significativamente associados às características de interesse a QTLs e genes previamente conhecidos, e 4) avaliar possíveis ganhos em acurácia das predições dos GEBVs combinando informações de SNP e CNV (GBa + CNV) comparadas às predições dos GEBVs utilizando exclusivamente informações SNP (GBa). Dessa forma, foram utilizadas informações genômicas de 491 ovinos da raça Santa Inês (OvineSNP50 BeadChip). A identificação de CNVs foi realizada por meio do software PennCNV. As informações de CNVs foram utilizadas para a construção de uma matriz de relacionamento genômico fundamentada em CNVs que foi incorporada ao modelo misto utilizado para a predição dos GEBVs adicionalmente às tradicionais informações de SNP. Na sequência, a acurácia foi estimada pela correlação de Pearson entre os GEBVs preditos para a população de treinamento e o fenótipo corrigido para efeitos fixos na população de validação. Os GEBVs preditos foram utilizados nas análises de associação genômica ampla fundamentadas em CNVs, por meio do programa CNVRanger, para identificar regiões no genoma associadas às características de desempenho, eficiência e carcaça. Foram identificados 1.167 segmentos de CNV, entre eles segmentos significantes (p-valor<0,05) associados às características: rendimento de carcaça e consumo alimentar residual, adicionalmente, outros 5 segmentos de CNV foram considerados relevantes e indicados para estudos futuros. Os segmentos significativos foram sobrepostos a 4 QTLs e 8 genes, entre eles os genes SPAST, TGFA e ADGRL3 com funções relacionadas a diferenciação celular e metabolismo energético. A inclusão de CNV nas análises genéticas permitiram capturar maior variância genética, entretanto a proporção da variância genética capturada por CNVs varia entre as características e não necessariamente incrementam a acurácia de predição. Entre os modelos considerados, não houve incremento na habilidade preditiva ao inserir informações de CNV. Portanto, os resultados reportados no presente estudo indicam que a inclusão de informações de CNV em modelos para predição de GEBV não deve ser prioridade.
id USP_dfa3cb03dc03f318509d7444387183f1
oai_identifier_str oai:teses.usp.br:tde-11102021-124537
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Identificação e uso de CNV para seleção genômica em ovinos da raça Santa InêsIdentification and use of CNV for genomic selection in Santa Inês sheepCordeirosGenomic relationship matrixHabilidade de prediçãoLambsMatriz de relacionamento genômicoPrediction abilityPrediction biasViés de prediçãoVariações no número de cópias (CNV) são variações estruturais no DNA de no mínimo 1 kb e que diferem do genoma referência quanto ao número de cópias. O crescente número de estudos com CNV reportam sua associação com doenças em humanos e diversas características quantitativas em animais domésticos. Entretanto, não foram reportados estudos de associação genômica ampla baseados em CNV em ovinos Santa Inês, uma das raças mais importantes do Brasil e, ademais, informações sobre a inclusão de efeitos de CNV em modelos de predição de GEBV são escassos. Assim, os objetivos do presente estudo foram 1) identificar e quantificar CNVs em uma população de ovinos da raça Santa Inês, 2) verificar possíveis associações entre CNVs e características de interesse, 3) identificar possível sobreposição de segmentos de CNVs significativamente associados às características de interesse a QTLs e genes previamente conhecidos, e 4) avaliar possíveis ganhos em acurácia das predições dos GEBVs combinando informações de SNP e CNV (GBa + CNV) comparadas às predições dos GEBVs utilizando exclusivamente informações SNP (GBa). Dessa forma, foram utilizadas informações genômicas de 491 ovinos da raça Santa Inês (OvineSNP50 BeadChip). A identificação de CNVs foi realizada por meio do software PennCNV. As informações de CNVs foram utilizadas para a construção de uma matriz de relacionamento genômico fundamentada em CNVs que foi incorporada ao modelo misto utilizado para a predição dos GEBVs adicionalmente às tradicionais informações de SNP. Na sequência, a acurácia foi estimada pela correlação de Pearson entre os GEBVs preditos para a população de treinamento e o fenótipo corrigido para efeitos fixos na população de validação. Os GEBVs preditos foram utilizados nas análises de associação genômica ampla fundamentadas em CNVs, por meio do programa CNVRanger, para identificar regiões no genoma associadas às características de desempenho, eficiência e carcaça. Foram identificados 1.167 segmentos de CNV, entre eles segmentos significantes (p-valor<0,05) associados às características: rendimento de carcaça e consumo alimentar residual, adicionalmente, outros 5 segmentos de CNV foram considerados relevantes e indicados para estudos futuros. Os segmentos significativos foram sobrepostos a 4 QTLs e 8 genes, entre eles os genes SPAST, TGFA e ADGRL3 com funções relacionadas a diferenciação celular e metabolismo energético. A inclusão de CNV nas análises genéticas permitiram capturar maior variância genética, entretanto a proporção da variância genética capturada por CNVs varia entre as características e não necessariamente incrementam a acurácia de predição. Entre os modelos considerados, não houve incremento na habilidade preditiva ao inserir informações de CNV. Portanto, os resultados reportados no presente estudo indicam que a inclusão de informações de CNV em modelos para predição de GEBV não deve ser prioridade.Copy number variations (CNV) are structural variations in DNA of at least 1 kb that differ from the reference genome in copy number. The growing number of studies with CNV report its association with diseases in humans and several quantitative traits in livestock animals. However, CNV-based genome-wide association studies in Santa Inês sheep, one of the most important breeds in Brazil, have not been reported and, furthermore, information on the inclusion of CNV effects in GEBV prediction models is rare. Thus, the aims of the present study were 1) to identify and quantify CNVs in a population of Santa Inês sheep, 2) to verify possible associations between CNVs and characteristics of interest, 3) to identify possible overlapping of CNV segments significantly associated with the characteristics of interest to previously known QTLs and genes, and 4) to evaluate possible gains in accuracy in GEBV predictions by combining SNP and CNV information (GBa + CNV) compared to GEBV predictions using exclusively SNP information (GBa). Thus, genomic information from 491 Santa Inês sheep (OvineSNP50 BeadChip) was used. The identification of CNVs was performed using the PennCNV software. The CNV information was used to build a genomic relationship matrix based on CNVs, which was incorporated into the mixed model used for the prediction of GEBVs in addition to the traditional SNP information. Next, accuracy was estimated by Pearson\'s correlation between predicted GEBVs for training population and phenotype corrected for fixed effects in the validation population. Predicted GEBVs were used in CNV-based genome-wide association analyses, through the CNVRanger program, to identify regions in the genome associated with performance, efficiency and carcass traits. 1,167 CNV segments were identified, including significant segments (p-value<0.05) associated with traits: carcass yield and residual feed intake, in addition, another 5 CNV segments were considered relevant and indicated for future studies. The significant segments overlapped 4 QTLs and 8 genes, including the SPAST, TGFA and ADGRL3 genes with functions related to cell differentiation and energy metabolism. The inclusion of CNV in the genetic analysis allowed capturing greater genetic variance, however the proportion of genetic variance captured by CNVs varies among characteristics and does not necessarily increase the prediction accuracy. Among the models considered, there was no increase in predictive ability when entering CNV information. Therefore, the results reported in the present study indicate that the inclusion of CNV information in models to predict GEBV should not be a priority.Biblioteca Digitais de Teses e Dissertações da USPMourão, Gerson BarretoLadeira, Giovanni Coelho2021-08-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/11/11139/tde-11102021-124537/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2021-10-13T19:21:02Zoai:teses.usp.br:tde-11102021-124537Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-10-13T19:21:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
Identification and use of CNV for genomic selection in Santa Inês sheep
title Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
spellingShingle Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
Ladeira, Giovanni Coelho
Cordeiros
Genomic relationship matrix
Habilidade de predição
Lambs
Matriz de relacionamento genômico
Prediction ability
Prediction bias
Viés de predição
title_short Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
title_full Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
title_fullStr Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
title_full_unstemmed Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
title_sort Identificação e uso de CNV para seleção genômica em ovinos da raça Santa Inês
author Ladeira, Giovanni Coelho
author_facet Ladeira, Giovanni Coelho
author_role author
dc.contributor.none.fl_str_mv Mourão, Gerson Barreto
dc.contributor.author.fl_str_mv Ladeira, Giovanni Coelho
dc.subject.por.fl_str_mv Cordeiros
Genomic relationship matrix
Habilidade de predição
Lambs
Matriz de relacionamento genômico
Prediction ability
Prediction bias
Viés de predição
topic Cordeiros
Genomic relationship matrix
Habilidade de predição
Lambs
Matriz de relacionamento genômico
Prediction ability
Prediction bias
Viés de predição
description Variações no número de cópias (CNV) são variações estruturais no DNA de no mínimo 1 kb e que diferem do genoma referência quanto ao número de cópias. O crescente número de estudos com CNV reportam sua associação com doenças em humanos e diversas características quantitativas em animais domésticos. Entretanto, não foram reportados estudos de associação genômica ampla baseados em CNV em ovinos Santa Inês, uma das raças mais importantes do Brasil e, ademais, informações sobre a inclusão de efeitos de CNV em modelos de predição de GEBV são escassos. Assim, os objetivos do presente estudo foram 1) identificar e quantificar CNVs em uma população de ovinos da raça Santa Inês, 2) verificar possíveis associações entre CNVs e características de interesse, 3) identificar possível sobreposição de segmentos de CNVs significativamente associados às características de interesse a QTLs e genes previamente conhecidos, e 4) avaliar possíveis ganhos em acurácia das predições dos GEBVs combinando informações de SNP e CNV (GBa + CNV) comparadas às predições dos GEBVs utilizando exclusivamente informações SNP (GBa). Dessa forma, foram utilizadas informações genômicas de 491 ovinos da raça Santa Inês (OvineSNP50 BeadChip). A identificação de CNVs foi realizada por meio do software PennCNV. As informações de CNVs foram utilizadas para a construção de uma matriz de relacionamento genômico fundamentada em CNVs que foi incorporada ao modelo misto utilizado para a predição dos GEBVs adicionalmente às tradicionais informações de SNP. Na sequência, a acurácia foi estimada pela correlação de Pearson entre os GEBVs preditos para a população de treinamento e o fenótipo corrigido para efeitos fixos na população de validação. Os GEBVs preditos foram utilizados nas análises de associação genômica ampla fundamentadas em CNVs, por meio do programa CNVRanger, para identificar regiões no genoma associadas às características de desempenho, eficiência e carcaça. Foram identificados 1.167 segmentos de CNV, entre eles segmentos significantes (p-valor<0,05) associados às características: rendimento de carcaça e consumo alimentar residual, adicionalmente, outros 5 segmentos de CNV foram considerados relevantes e indicados para estudos futuros. Os segmentos significativos foram sobrepostos a 4 QTLs e 8 genes, entre eles os genes SPAST, TGFA e ADGRL3 com funções relacionadas a diferenciação celular e metabolismo energético. A inclusão de CNV nas análises genéticas permitiram capturar maior variância genética, entretanto a proporção da variância genética capturada por CNVs varia entre as características e não necessariamente incrementam a acurácia de predição. Entre os modelos considerados, não houve incremento na habilidade preditiva ao inserir informações de CNV. Portanto, os resultados reportados no presente estudo indicam que a inclusão de informações de CNV em modelos para predição de GEBV não deve ser prioridade.
publishDate 2021
dc.date.none.fl_str_mv 2021-08-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/11/11139/tde-11102021-124537/
url https://www.teses.usp.br/teses/disponiveis/11/11139/tde-11102021-124537/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090629262639104