Identification of structural variants and selection signatures in cattle

Detalhes bibliográficos
Autor(a) principal: Peripolli, Elisa [UNESP]
Data de Publicação: 2021
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/202711
Resumo: Devido aos impactos causados na produção animal recorrentes das mudanças climáticas, é importante caracterizar o genoma bovino para desvendar os mecanismos genéticos envolvidos na variação fenotípica que foram influenciados pelo ambiente e moldados pela seleção natural. O objetivo deste estudo é descrever os principais efeitos da adaptação e seleção em animais zebuínos e taurinos localmente adaptadas através da identificação de variações estruturais e assinaturas de seleção utilizando dados genotípicos e de sequenciamento de genoma inteiro. No capítulo 2, foram utilizados genótipos imputados (n=735.044 marcadores) de 9,386 animais da raça Nellore e de suas respectivas linhagens a fim de estimar a autozigosidade do genoma baseado nas corridas de homozigose (ROH) por meio do software Plink. Em geral, os coeficientes de endogamia baseados em ROH (FROH) não foram altos, com valores próximos a 2%. As ilhas de autozigosidade foram evidentes em todo o genoma e sua localização não diferiu em grande número dentro das linhagens. Termos enriquecidos (p<0,01) dentro das ilhas de autozigosidade sugeriam uma forte seleção para características relacionadas à resposta imune, podendo explicar uma maior adaptabilidade do gado zebuíno em ambientes severos. O capítulo 3 visou avaliar a autozigosidade de todo o genoma para explorar regiões ricas em ROH que poderiam melhor caracterizar os diferentes tipos biológicos (produtivo ou adaptativo) do gado de corte composto Montana Tropical®. Animais Montana (n=1.436) foram genotipados com o GGP-LD BeadChip (n=30.105 marcadores) e os ROH foram identificados em cada indivíduo usando o software Plink. O número de ilhas de autozigosidade não diferiu consideravelmente entre os tipos biológicos e não foi encontrado nenhum termo enriquecido significativo (p<0,05) compartilhado entre eles. Termos enriquecidos associados à resposta imunológica e homeostase foram descritos para o tipo biológico adaptativo, enquanto aqueles ligados ao sistema imunológico, bem como às funções reprodutivas e produtivas, foram identificados para o tipo biológico produtivo. No capítulo 4, quatro métodos estatísticos foram implementados para detectar regiões genômicas sob pressão seletiva usando dados de sequenciamento de genoma inteiro (12.4 X) de bovinos das raças Gir (GIR, n=13), Caracu Caldeano (CAR, n=12), Crioulo Lageano (CRL, n=12) e Pantaneiro (PAN, n=12). As estatísticas dentro de população (CLR e iHS) e entre populações (FST e XPEHH) foram combinadas separadamente em um único valor por meio do método ‘de-correlated composite of multiple signals’ (DCMS). As regiões de varredura seletiva foram identificadas por meio dos valores do limite superior (1%) da distribuição empírica gerada por cada estatística DCMS. As assinaturas de seleção identificadas forneceram uma percepção abrangente de genes candidatos juntamente com QTLs relacionadas a características produtivas e de adaptação ao ambiente hostil no qual estas raças foram expostas. No capítulo 5, o método de leitura baseada em ‘read-depth’ implementado no software CNVnator foi utilizado para identificar variações no número de cópias (CNVs) utilizando dados de sequenciamento de genoma inteiro (14.07 X) de bovinos das raças CAR (n=12), CRL (n=12) e PAN (n=12). Regiões de CNV (CNVRs) foram identificadas sobrepondo as CNVs individuais dentro de cada raça. A anotação funcional das CNVRs revelou variantes com elevada consequência na sequência proteica abrangendo genes fortemente associados a resiliência ambiental, dentre os quais podemos destacar o BOLA-DQB, BOLA-DQA5, CD1A, β-defensins, PRG3 e ULBP21. A análise de enriquecimento funcional utilizando os genes prospectados nas CNVRs também revelou termos significativos (p<0.01) fortemente associados à imunidade e resistência do gado a ambientes severos. Nossos resultados elucidaram os mecanismos biológicos inerentes as raças bovinas aqui estudadas, fornecendo informações a respeito de genes candidatos e regiões genômicas que abrangem características adaptativas relevantes, bem como informações úteis para futuras abordagens de conservação, estudos de associação ou seleção.
id UNSP_c497ff1dcad9dd1e29f005409c80eb39
oai_identifier_str oai:repositorio.unesp.br:11449/202711
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Identification of structural variants and selection signatures in cattleIdentificação de variações estruturais e assinaturas de seleção em bovinosAdaptaçãoRecursos genéticosSequenciamento de nova geraçãoVarreduras de seleçãoBos taurus taurusBos taurus indicusDevido aos impactos causados na produção animal recorrentes das mudanças climáticas, é importante caracterizar o genoma bovino para desvendar os mecanismos genéticos envolvidos na variação fenotípica que foram influenciados pelo ambiente e moldados pela seleção natural. O objetivo deste estudo é descrever os principais efeitos da adaptação e seleção em animais zebuínos e taurinos localmente adaptadas através da identificação de variações estruturais e assinaturas de seleção utilizando dados genotípicos e de sequenciamento de genoma inteiro. No capítulo 2, foram utilizados genótipos imputados (n=735.044 marcadores) de 9,386 animais da raça Nellore e de suas respectivas linhagens a fim de estimar a autozigosidade do genoma baseado nas corridas de homozigose (ROH) por meio do software Plink. Em geral, os coeficientes de endogamia baseados em ROH (FROH) não foram altos, com valores próximos a 2%. As ilhas de autozigosidade foram evidentes em todo o genoma e sua localização não diferiu em grande número dentro das linhagens. Termos enriquecidos (p<0,01) dentro das ilhas de autozigosidade sugeriam uma forte seleção para características relacionadas à resposta imune, podendo explicar uma maior adaptabilidade do gado zebuíno em ambientes severos. O capítulo 3 visou avaliar a autozigosidade de todo o genoma para explorar regiões ricas em ROH que poderiam melhor caracterizar os diferentes tipos biológicos (produtivo ou adaptativo) do gado de corte composto Montana Tropical®. Animais Montana (n=1.436) foram genotipados com o GGP-LD BeadChip (n=30.105 marcadores) e os ROH foram identificados em cada indivíduo usando o software Plink. O número de ilhas de autozigosidade não diferiu consideravelmente entre os tipos biológicos e não foi encontrado nenhum termo enriquecido significativo (p<0,05) compartilhado entre eles. Termos enriquecidos associados à resposta imunológica e homeostase foram descritos para o tipo biológico adaptativo, enquanto aqueles ligados ao sistema imunológico, bem como às funções reprodutivas e produtivas, foram identificados para o tipo biológico produtivo. No capítulo 4, quatro métodos estatísticos foram implementados para detectar regiões genômicas sob pressão seletiva usando dados de sequenciamento de genoma inteiro (12.4 X) de bovinos das raças Gir (GIR, n=13), Caracu Caldeano (CAR, n=12), Crioulo Lageano (CRL, n=12) e Pantaneiro (PAN, n=12). As estatísticas dentro de população (CLR e iHS) e entre populações (FST e XPEHH) foram combinadas separadamente em um único valor por meio do método ‘de-correlated composite of multiple signals’ (DCMS). As regiões de varredura seletiva foram identificadas por meio dos valores do limite superior (1%) da distribuição empírica gerada por cada estatística DCMS. As assinaturas de seleção identificadas forneceram uma percepção abrangente de genes candidatos juntamente com QTLs relacionadas a características produtivas e de adaptação ao ambiente hostil no qual estas raças foram expostas. No capítulo 5, o método de leitura baseada em ‘read-depth’ implementado no software CNVnator foi utilizado para identificar variações no número de cópias (CNVs) utilizando dados de sequenciamento de genoma inteiro (14.07 X) de bovinos das raças CAR (n=12), CRL (n=12) e PAN (n=12). Regiões de CNV (CNVRs) foram identificadas sobrepondo as CNVs individuais dentro de cada raça. A anotação funcional das CNVRs revelou variantes com elevada consequência na sequência proteica abrangendo genes fortemente associados a resiliência ambiental, dentre os quais podemos destacar o BOLA-DQB, BOLA-DQA5, CD1A, β-defensins, PRG3 e ULBP21. A análise de enriquecimento funcional utilizando os genes prospectados nas CNVRs também revelou termos significativos (p<0.01) fortemente associados à imunidade e resistência do gado a ambientes severos. Nossos resultados elucidaram os mecanismos biológicos inerentes as raças bovinas aqui estudadas, fornecendo informações a respeito de genes candidatos e regiões genômicas que abrangem características adaptativas relevantes, bem como informações úteis para futuras abordagens de conservação, estudos de associação ou seleção.Given the impacts caused by climate change upon livestock production, it is important to characterize the cattle genome to unravel the genetic mechanisms underlying phenotypic variation that were influenced by the environment and shaped by natural selection that allowed them to thrive in distinct ecosystems. Therefore, the objective of this study is to describe the main effects of adaptation and selection in indicine and locally adapted taurine cattle breeds through the identification of structural variants and signatures of selection using genotypic and whole-genome re-sequencing data. In chapter 2, imputed genotypes (n=735,044 markers) were used to assess genome-wide autozygosity based on runs of homozygosity (ROH) in 9,386 Nellore animals and its lineages using the Plink software. Overall, inbreeding coefficients based on ROH (FROH) were not high, with values close to 2%. Autozygosity islands were evident across the genome, and their genomic location did not largely differ within lineages. Enriched terms (p<0.01) within the autozygosity islands suggested a strong selection for immune response-related traits and might explain the greater adaptability of the indicine cattle in harsh environments. Chapter 3 aimed to assess genome-wide autozygosity to explore ROH hotspot regions which could better characterize the different biological types (productive or adaptive) within the composite Montana Tropical® beef cattle. Montana animals (n=1,436) were genotyped with the GGP-LD BeadChip (n=30,105 markers), and ROH were identified in every individual using the Plink software. The number of autozygosity islands did not differ considerably between biological types, and no significant enriched term (p<0.05) was found to be shared between them. Enriched terms associated with the immune response and homeostasis were described for the adaptive biological type, while those linked to the immune system as well as with reproductive and productive functions we identified for the productive biological type. In chapter 4, four statistical methods were implemented to detect genomic regions under selective pressure using whole-genome re-sequencing data from Gir (GIR, n=13), Caracu Caldeano (CAR, n=12), Crioulo Lageano (CRL, n=12), and Pantaneiro (PAN, n=12) cattle breeds. Within-population (CLR and iHS) and cross-population statistics (FST and XPEHH) were combined separately in a single score using the de-correlated composite of multiple signals (DCMS) method, and putative sweep regions were revealed by assessing the top 1% of the empirical distribution generated by each DCMS statistic. The signatures of selection identified herein provided a comprehensive set of putative candidate genes together with QTLs disclosing cattle production traits and adaptation to the challenging environment in which these breeds have been exposed. In chapter 5, the read depth-based method implemented in CNVnator was used for copy number variants (CNV) calling on resequenced data (~14.07 X) from CAR (n=12), CRL (n=12), and PAN (n=12) cattle breeds. CNV regions (CNVRs) were identified by overlapping individual CNVs within each breed. The functional annotation of the CNVRs revealed variants with high consequence on protein sequence harboring relevant genes with functions strongly linked to environmental resilience (i.e., BOLA-DQB, BOLA-DQA5, CD1A, β-defensins, PRG3, and ULBP21). Enrichment analysis based on the gene list retrieved from the viii CNVRs also disclosed over-represented terms (p<0.01) greatly associated with immunity and cattle resistance to harsh environments. Our findings improve the knowledge about the genome biology of such cattle breeds and provide candidate genes and genomic regions encompassing relevant traits as well as useful information for future conservation, association, or selection approaches.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)FAPESP: 2016/24084-7Universidade Estadual Paulista (Unesp)Rey, Fernando Sebastian Baldi [UNESP]Silva, Marcos Vinicius Gualberto Barbosa daUniversidade Estadual Paulista (Unesp)Peripolli, Elisa [UNESP]2021-02-16T13:16:28Z2021-02-16T13:16:28Z2021-02-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/11449/20271133004102030P4enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-06-05T18:32:47Zoai:repositorio.unesp.br:11449/202711Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T22:10:23.048241Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Identification of structural variants and selection signatures in cattle
Identificação de variações estruturais e assinaturas de seleção em bovinos
title Identification of structural variants and selection signatures in cattle
spellingShingle Identification of structural variants and selection signatures in cattle
Peripolli, Elisa [UNESP]
Adaptação
Recursos genéticos
Sequenciamento de nova geração
Varreduras de seleção
Bos taurus taurus
Bos taurus indicus
title_short Identification of structural variants and selection signatures in cattle
title_full Identification of structural variants and selection signatures in cattle
title_fullStr Identification of structural variants and selection signatures in cattle
title_full_unstemmed Identification of structural variants and selection signatures in cattle
title_sort Identification of structural variants and selection signatures in cattle
author Peripolli, Elisa [UNESP]
author_facet Peripolli, Elisa [UNESP]
author_role author
dc.contributor.none.fl_str_mv Rey, Fernando Sebastian Baldi [UNESP]
Silva, Marcos Vinicius Gualberto Barbosa da
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Peripolli, Elisa [UNESP]
dc.subject.por.fl_str_mv Adaptação
Recursos genéticos
Sequenciamento de nova geração
Varreduras de seleção
Bos taurus taurus
Bos taurus indicus
topic Adaptação
Recursos genéticos
Sequenciamento de nova geração
Varreduras de seleção
Bos taurus taurus
Bos taurus indicus
description Devido aos impactos causados na produção animal recorrentes das mudanças climáticas, é importante caracterizar o genoma bovino para desvendar os mecanismos genéticos envolvidos na variação fenotípica que foram influenciados pelo ambiente e moldados pela seleção natural. O objetivo deste estudo é descrever os principais efeitos da adaptação e seleção em animais zebuínos e taurinos localmente adaptadas através da identificação de variações estruturais e assinaturas de seleção utilizando dados genotípicos e de sequenciamento de genoma inteiro. No capítulo 2, foram utilizados genótipos imputados (n=735.044 marcadores) de 9,386 animais da raça Nellore e de suas respectivas linhagens a fim de estimar a autozigosidade do genoma baseado nas corridas de homozigose (ROH) por meio do software Plink. Em geral, os coeficientes de endogamia baseados em ROH (FROH) não foram altos, com valores próximos a 2%. As ilhas de autozigosidade foram evidentes em todo o genoma e sua localização não diferiu em grande número dentro das linhagens. Termos enriquecidos (p<0,01) dentro das ilhas de autozigosidade sugeriam uma forte seleção para características relacionadas à resposta imune, podendo explicar uma maior adaptabilidade do gado zebuíno em ambientes severos. O capítulo 3 visou avaliar a autozigosidade de todo o genoma para explorar regiões ricas em ROH que poderiam melhor caracterizar os diferentes tipos biológicos (produtivo ou adaptativo) do gado de corte composto Montana Tropical®. Animais Montana (n=1.436) foram genotipados com o GGP-LD BeadChip (n=30.105 marcadores) e os ROH foram identificados em cada indivíduo usando o software Plink. O número de ilhas de autozigosidade não diferiu consideravelmente entre os tipos biológicos e não foi encontrado nenhum termo enriquecido significativo (p<0,05) compartilhado entre eles. Termos enriquecidos associados à resposta imunológica e homeostase foram descritos para o tipo biológico adaptativo, enquanto aqueles ligados ao sistema imunológico, bem como às funções reprodutivas e produtivas, foram identificados para o tipo biológico produtivo. No capítulo 4, quatro métodos estatísticos foram implementados para detectar regiões genômicas sob pressão seletiva usando dados de sequenciamento de genoma inteiro (12.4 X) de bovinos das raças Gir (GIR, n=13), Caracu Caldeano (CAR, n=12), Crioulo Lageano (CRL, n=12) e Pantaneiro (PAN, n=12). As estatísticas dentro de população (CLR e iHS) e entre populações (FST e XPEHH) foram combinadas separadamente em um único valor por meio do método ‘de-correlated composite of multiple signals’ (DCMS). As regiões de varredura seletiva foram identificadas por meio dos valores do limite superior (1%) da distribuição empírica gerada por cada estatística DCMS. As assinaturas de seleção identificadas forneceram uma percepção abrangente de genes candidatos juntamente com QTLs relacionadas a características produtivas e de adaptação ao ambiente hostil no qual estas raças foram expostas. No capítulo 5, o método de leitura baseada em ‘read-depth’ implementado no software CNVnator foi utilizado para identificar variações no número de cópias (CNVs) utilizando dados de sequenciamento de genoma inteiro (14.07 X) de bovinos das raças CAR (n=12), CRL (n=12) e PAN (n=12). Regiões de CNV (CNVRs) foram identificadas sobrepondo as CNVs individuais dentro de cada raça. A anotação funcional das CNVRs revelou variantes com elevada consequência na sequência proteica abrangendo genes fortemente associados a resiliência ambiental, dentre os quais podemos destacar o BOLA-DQB, BOLA-DQA5, CD1A, β-defensins, PRG3 e ULBP21. A análise de enriquecimento funcional utilizando os genes prospectados nas CNVRs também revelou termos significativos (p<0.01) fortemente associados à imunidade e resistência do gado a ambientes severos. Nossos resultados elucidaram os mecanismos biológicos inerentes as raças bovinas aqui estudadas, fornecendo informações a respeito de genes candidatos e regiões genômicas que abrangem características adaptativas relevantes, bem como informações úteis para futuras abordagens de conservação, estudos de associação ou seleção.
publishDate 2021
dc.date.none.fl_str_mv 2021-02-16T13:16:28Z
2021-02-16T13:16:28Z
2021-02-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/202711
33004102030P4
url http://hdl.handle.net/11449/202711
identifier_str_mv 33004102030P4
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808129399697965056