Applying next generation sequence data in animal breeding

Detalhes bibliográficos
Autor(a) principal: Oliveira, Haniel Cedraz de
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: eng
Título da fonte: LOCUS Repositório Institucional da UFV
Texto Completo: https://locus.ufv.br//handle/123456789/29393
Resumo: No Melhoramento Animal existe um histórico de utilizar dados fenotípicos dos melhores animais de uma geração para produzir a próxima geração. Entretanto, é sabido que a herdabilidade das características de interesse depende de uma base genética e podem ser explicadas através do DNA. Na genética quantitativa é usado o modelo básico que diz que o fenótipo é a soma do genótipo (composição genética do indivíduo) e do ambiente, entretanto, genótipos diferentes podem desempenhar resultados superiores ou inferiores dependendo do ambiente em que estão inseridos, com isso, houve a necessidade de incluir o fator interação entre o genótipo e o ambiente. Com o desenvolvimento tecnológico, o sequenciamento de nova geração (NGS) tem trazido avanços no entendimento de características complexas no melhoramento animal, com o sequenciamento completo do genoma dos animais domésticos foi possível melhor entender como variantes causais e estruturais tem influenciado o fenótipo. Com o uso do NGS é possível quantificar o mRNA que está sendo expresso de um determinado gene que influencia determinada característica (transcriptoma – RNA-Seq), descobrir alterações epigenéticas (ChIP-Seq) e, então, conhecer melhor os mecanismos moleculares que modulam a característica e tecido em questão; aumentar a densidade de marcadores de nucleotídeos simples (SNP) com o sequenciamento do genoma completo (WGS) e então, descobrir associações genômicas mais significativas e mais precisas. Com o advento do NGS veio a necessidade de o desenvolvimento poder computacional e novas ferramentas capazes de analisar e armazenar a quantidade de dados gerada. Em função disso, o desenvolvimento de softwares capazes de realizar o controle de qualidade, mapeamento das sequencias contra o genoma de referencia e, quantificar os transcritos (no caso de RNA- Seq) tem se tornado necessário e, lidar com esse tipo de análise pode ser difícil para aqueles que não tem familiaridade com sistemas computacionais. Visto isso foi desenvolvido um pipeline de uso amigável para analisar dados de RNA-Seq, realizando controle de qualidade, mapeamento e contagem de sequencias. O BAQCOM (Bioinformatics Analysis of Quality Control and Mapping) tem se mostrado eficiente e rápido. Utilizando dados de RNA-Seq objetivou-se conhecer o perfil global de expressão gênica envolvido em Condronecrose Bacteriana com Osteomielite em frangos (BCO), que é desenvolvida nas placas de crescimento ósseo do fêmur e tíbia e colonizada por bactérias oportunistas. Utilizando amostras de tíbia de seis frangos de linhagem comercial (três afetados por BCO e três sadios), foram encontrados 192 genes diferencialmente expressos (FDR < 0.05) divididos em 63 upregulados e 129 downregulados. 26 genes e sete fatores de transcrição foram encontrados downregulados explicando BCO em tíbia, podendo concluir que a BCO em frangos pode ser causada pela baixa expressão de genes relacionados ao crescimento ósseo e, que, a proliferação bacteriana parece ser um processo secundário. Outro cenário para o uso de NGS é o mapeamento fino de região de QTL (quantitative Traits Loci). Uma região de QTL no cromossomo 5 associada com espessura de toucinho foi encontrada em quatro linhagens comercial de suínos (sintético baseado em large-white, Pietrain, Landrace e Large-White). Espessura de toucinho é importante para eficiência alimentar e qualidade de carne, além de ser reservatório energético. Embora Genome Wide Association Study (GWAS) tem sido amplamente usada associada à fenótipos, ainda há a necessidade de reduzir a região de associação se o objetivo é achar mutações causais. Por essa razão objetivou-se reduzir esta região de QTL usando dados de WGS, RNA-Seq e ChIP-Seq. A partir do SNP mais significativo do GWAS (leadSNP – SSC5:66103958), os haplótipos foram postos em fase e selecionados haplótipos de tamanho 41 SNPs (20 < leadSNP > 20). Foi selecionado o haplótipo mais frequente entre as linhagens utilizadas, então foi possível identificar uma região de 5 SNPs (2 < leadSNP > 2) presente em todas as linhagens. A partir desta região foi realizado o mapeamento fino, primeiro foi utilizado WGS e foi identificado três variantes candidatas (SSC5:66097445, SSC5:66099282 e SSC5c66103958). Nesta região entre SSC5:66097445-66103958 foram encontradas marcas epigenéticas H3K27me3 e H3K4me3 utilizado dados de ChIP-Seq de macrófagos alveolar de suínos, indicando regulação de expressão gênica durante período de desenvolvimento pre-natal. Em função disso foram utilizados RNA-Seq de embriões e fetos, onde foi possível encontrar alta expressão do gene CCND2, que está relacionado ao desenvolvimento e diferenciação de tecido adiposo, sendo um forte candidato a gene causal para espessura de toucinho. É possível, também, concluir que nesta região pode ter elementos regulatórios envolvidos na expressão do gene CCND2 no desenvolvimento embrionário e que, o impacto epigenético durante a vida embrionária pode impactar a produção de características na vida adulta. Nessa tese foi usado dados de sequenciamento, genotipagem, fenótipo, transcriptoma e ChIP-Seq, integrando todos para estreitar regiões de interesse no genoma, assim, resultando e propondo ferramentas para melhorar o melhoramento animal no futuro. Palavras-chave: Genômica. Sequenciamento de Genoma Completo. Transcriptoma. ChIP- Seq. Fenótipo.
id UFV_14f256ba3c0cc47a20931e03b2e96025
oai_identifier_str oai:locus.ufv.br:123456789/29393
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str 2145
spelling Peixoto, Jane de OliveiraLopes, Marcos SoaresOliveira, Haniel Cedraz dehttp://lattes.cnpq.br/4348957268318673Guimarães, Simone Eliza Facioni2022-07-22T12:24:10Z2022-07-22T12:24:10Z2020-09-30OLIVEIRA, Haniel Cedraz de. Applying next generation sequence data in animal breeding. 2020. 85 f. Tese (Doutorado em Zootecnia) - Universidade Federal de Viçosa, Viçosa. 2020.https://locus.ufv.br//handle/123456789/29393No Melhoramento Animal existe um histórico de utilizar dados fenotípicos dos melhores animais de uma geração para produzir a próxima geração. Entretanto, é sabido que a herdabilidade das características de interesse depende de uma base genética e podem ser explicadas através do DNA. Na genética quantitativa é usado o modelo básico que diz que o fenótipo é a soma do genótipo (composição genética do indivíduo) e do ambiente, entretanto, genótipos diferentes podem desempenhar resultados superiores ou inferiores dependendo do ambiente em que estão inseridos, com isso, houve a necessidade de incluir o fator interação entre o genótipo e o ambiente. Com o desenvolvimento tecnológico, o sequenciamento de nova geração (NGS) tem trazido avanços no entendimento de características complexas no melhoramento animal, com o sequenciamento completo do genoma dos animais domésticos foi possível melhor entender como variantes causais e estruturais tem influenciado o fenótipo. Com o uso do NGS é possível quantificar o mRNA que está sendo expresso de um determinado gene que influencia determinada característica (transcriptoma – RNA-Seq), descobrir alterações epigenéticas (ChIP-Seq) e, então, conhecer melhor os mecanismos moleculares que modulam a característica e tecido em questão; aumentar a densidade de marcadores de nucleotídeos simples (SNP) com o sequenciamento do genoma completo (WGS) e então, descobrir associações genômicas mais significativas e mais precisas. Com o advento do NGS veio a necessidade de o desenvolvimento poder computacional e novas ferramentas capazes de analisar e armazenar a quantidade de dados gerada. Em função disso, o desenvolvimento de softwares capazes de realizar o controle de qualidade, mapeamento das sequencias contra o genoma de referencia e, quantificar os transcritos (no caso de RNA- Seq) tem se tornado necessário e, lidar com esse tipo de análise pode ser difícil para aqueles que não tem familiaridade com sistemas computacionais. Visto isso foi desenvolvido um pipeline de uso amigável para analisar dados de RNA-Seq, realizando controle de qualidade, mapeamento e contagem de sequencias. O BAQCOM (Bioinformatics Analysis of Quality Control and Mapping) tem se mostrado eficiente e rápido. Utilizando dados de RNA-Seq objetivou-se conhecer o perfil global de expressão gênica envolvido em Condronecrose Bacteriana com Osteomielite em frangos (BCO), que é desenvolvida nas placas de crescimento ósseo do fêmur e tíbia e colonizada por bactérias oportunistas. Utilizando amostras de tíbia de seis frangos de linhagem comercial (três afetados por BCO e três sadios), foram encontrados 192 genes diferencialmente expressos (FDR < 0.05) divididos em 63 upregulados e 129 downregulados. 26 genes e sete fatores de transcrição foram encontrados downregulados explicando BCO em tíbia, podendo concluir que a BCO em frangos pode ser causada pela baixa expressão de genes relacionados ao crescimento ósseo e, que, a proliferação bacteriana parece ser um processo secundário. Outro cenário para o uso de NGS é o mapeamento fino de região de QTL (quantitative Traits Loci). Uma região de QTL no cromossomo 5 associada com espessura de toucinho foi encontrada em quatro linhagens comercial de suínos (sintético baseado em large-white, Pietrain, Landrace e Large-White). Espessura de toucinho é importante para eficiência alimentar e qualidade de carne, além de ser reservatório energético. Embora Genome Wide Association Study (GWAS) tem sido amplamente usada associada à fenótipos, ainda há a necessidade de reduzir a região de associação se o objetivo é achar mutações causais. Por essa razão objetivou-se reduzir esta região de QTL usando dados de WGS, RNA-Seq e ChIP-Seq. A partir do SNP mais significativo do GWAS (leadSNP – SSC5:66103958), os haplótipos foram postos em fase e selecionados haplótipos de tamanho 41 SNPs (20 < leadSNP > 20). Foi selecionado o haplótipo mais frequente entre as linhagens utilizadas, então foi possível identificar uma região de 5 SNPs (2 < leadSNP > 2) presente em todas as linhagens. A partir desta região foi realizado o mapeamento fino, primeiro foi utilizado WGS e foi identificado três variantes candidatas (SSC5:66097445, SSC5:66099282 e SSC5c66103958). Nesta região entre SSC5:66097445-66103958 foram encontradas marcas epigenéticas H3K27me3 e H3K4me3 utilizado dados de ChIP-Seq de macrófagos alveolar de suínos, indicando regulação de expressão gênica durante período de desenvolvimento pre-natal. Em função disso foram utilizados RNA-Seq de embriões e fetos, onde foi possível encontrar alta expressão do gene CCND2, que está relacionado ao desenvolvimento e diferenciação de tecido adiposo, sendo um forte candidato a gene causal para espessura de toucinho. É possível, também, concluir que nesta região pode ter elementos regulatórios envolvidos na expressão do gene CCND2 no desenvolvimento embrionário e que, o impacto epigenético durante a vida embrionária pode impactar a produção de características na vida adulta. Nessa tese foi usado dados de sequenciamento, genotipagem, fenótipo, transcriptoma e ChIP-Seq, integrando todos para estreitar regiões de interesse no genoma, assim, resultando e propondo ferramentas para melhorar o melhoramento animal no futuro. Palavras-chave: Genômica. Sequenciamento de Genoma Completo. Transcriptoma. ChIP- Seq. Fenótipo.In Animal Breeding there is a history of using phenotypic data of the best animals from one generation to produce the next one. However, it is known that the heritability of interest traits depends on a genetic basis and can be explained by the DNA. In quantitative genetics, the basic model says that the phenotype is the sum of the genotype (genetic composition of the individual) and the environment, however, different genotypes can perform superior or inferior results depending on the environment in which they are inserted, with that, there was the need to include an interaction factor at the genotype and the environment. The development of Next Generation Sequencing (NGS) has brought advances in the understanding of complex traits in animal breeding, with the Whole Genome Sequencing (WGS) of the domestic animals it was possible to better understand how causal and structural variants have influenced the phenotype. With the use of NGS it is possible to quantify the mRNA that is being expressed of a certain gene that influences a certain trait (transcriptome - RNA-Seq), discover epigenetic changes (ChIP-Seq) and, then, better understand the molecular mechanisms that modulate the trait and tissue in question; increase the density of Simple Nucleotide Polymorphism Markers (SNP) with WGS and then discover more significant and more accurate genomic associations. With the advent of NGS came the need for the development of computational power and new tools capable of analyzing and storing the amount of data generated. As a result, the development of software capable of performing quality control, mapping sequences against the reference genome and quantifying the transcripts (in the case of RNA-Seq) has become necessary and, dealing with this type of analysis can be difficult for those unfamiliar with computer systems. For this reason, a user- friendly pipeline was developed to analyze RNA-Seq data, carrying out quality control, mapping and sequence counting. BAQCOM (Bioinformatics Analysis of Quality Control and Mapping) has been shown to be efficient and fast. Using RNA-Seq data, it was aimed to know the global gene expression profile involved in Bacterial Chondronecrosis with Osteomyelitis (BCO) in chicken, which is developed in the bone growth plates of the femur and tibia followed by opportunistic bacteria. Using tibia samples from six commercial broilers (three affected by BCO and three healthy), 192 differentially expressed genes (FDR <0.05) were found (63 upregulated and 129 downregulated). 26 genes and seven transcription factors were found downregulated, explaining BCO in tibia, concluding that BCO in chickens may be caused by the low expression of genes related to bone growth and that bacterial proliferation seems to be a secondary process. Another scenario for the use of NGS is the fine mapping of QTL (quantitative Traits Loci) regions. A QTL region on chromosome 5 associated with backfat thickness was found in four commercial pig lines (synthetic based on large-white, Pietrain, Landrace and Large-White). Backfat is important for feed efficiency and meat quality, as well as being a storage of energy. Although the Genome Wide Association Study (GWAS) has been widely used in association with phenotypes, there is still a need to reduce the associated region if the goal is to find causal mutations. For this reason, it was aimed to reduce this QTL region using data from WGS, RNA-Seq and ChIP- Seq. From the most significant SNP of GWAS (leadSNP - SSC5:66103958), haplotypes were phased and haplotypes of size 41 SNPs (20 <leadSNP> 20) were selected. The most frequent haplotype was selected among the four breeds, so it was possible to identify a region of 5 SNPs (2 <leadSNP> 2) cross breed. Fine mapping was carried out using this region, first WGS was used and three candidate variants were identified (SSC5:66097445, SSC5:66099282 and SSC5:66103958). In this region between SSC5:66097445-66103958 epigenetic marks H3K27me3 and H3K4me3 were found using ChIP-Seq data from pig alveolar macrophages, indicating regulation of gene expression during the prenatal development period. From this result, RNA-Seq from embryos and fetuses were used, where it was possible to find high expression of the CCND2 gene, which is related to the development and differentiation of adipose tissue, being a strong candidate for a causal gene for backfat. It is also possible to conclude that in this region there may be regulatory elements involved in the expression of the CCND2 gene in embryonic development and that the epigenetic impact during embryonic life can impact the production of traits in adult life. In this thesis, sequencing, genotyping, phenotype, transcriptome and ChIP-Seq data were used, integrating them all to narrow down regions of interest in the genome, thus resulting and proposing tools to improve animal breeding in the future. Keywords: Genomics. Whole Genome Sequencing. Transcriptome. ChIP-Sequencing. Phenotype.Conselho Nacional de Desenvolvimento Científico e TecnológicoengUniversidade Federal de ViçosaZootecniaMelhoramento genéticoFenótipoGenômicaSequenciamento de nucleotídeoTranscriptomaGenética e Melhoramento dos Animais DomésticosApplying next generation sequence data in animal breedingAplicação de sequenciamento de próxima geração no melhoramento animalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal de ViçosaDepartamento de ZootecniaDoutor em ZootecniaViçosa - MG2020-09-30Doutoradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf3340687https://locus.ufv.br//bitstream/123456789/29393/1/texto%20completo.pdf6d5bb42e3b4ec02321568df57bb232a7MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/29393/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/293932023-05-16 15:32:08.261oai:locus.ufv.br:123456789/29393Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452023-05-16T18:32:08LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.en.fl_str_mv Applying next generation sequence data in animal breeding
dc.title.pt-BR.fl_str_mv Aplicação de sequenciamento de próxima geração no melhoramento animal
title Applying next generation sequence data in animal breeding
spellingShingle Applying next generation sequence data in animal breeding
Oliveira, Haniel Cedraz de
Melhoramento genético
Fenótipo
Genômica
Sequenciamento de nucleotídeo
Transcriptoma
Genética e Melhoramento dos Animais Domésticos
title_short Applying next generation sequence data in animal breeding
title_full Applying next generation sequence data in animal breeding
title_fullStr Applying next generation sequence data in animal breeding
title_full_unstemmed Applying next generation sequence data in animal breeding
title_sort Applying next generation sequence data in animal breeding
author Oliveira, Haniel Cedraz de
author_facet Oliveira, Haniel Cedraz de
author_role author
dc.contributor.authorLattes.pt-BR.fl_str_mv http://lattes.cnpq.br/4348957268318673
dc.contributor.none.fl_str_mv Peixoto, Jane de Oliveira
Lopes, Marcos Soares
dc.contributor.author.fl_str_mv Oliveira, Haniel Cedraz de
dc.contributor.advisor1.fl_str_mv Guimarães, Simone Eliza Facioni
contributor_str_mv Guimarães, Simone Eliza Facioni
dc.subject.pt-BR.fl_str_mv Melhoramento genético
Fenótipo
Genômica
Sequenciamento de nucleotídeo
Transcriptoma
topic Melhoramento genético
Fenótipo
Genômica
Sequenciamento de nucleotídeo
Transcriptoma
Genética e Melhoramento dos Animais Domésticos
dc.subject.cnpq.fl_str_mv Genética e Melhoramento dos Animais Domésticos
description No Melhoramento Animal existe um histórico de utilizar dados fenotípicos dos melhores animais de uma geração para produzir a próxima geração. Entretanto, é sabido que a herdabilidade das características de interesse depende de uma base genética e podem ser explicadas através do DNA. Na genética quantitativa é usado o modelo básico que diz que o fenótipo é a soma do genótipo (composição genética do indivíduo) e do ambiente, entretanto, genótipos diferentes podem desempenhar resultados superiores ou inferiores dependendo do ambiente em que estão inseridos, com isso, houve a necessidade de incluir o fator interação entre o genótipo e o ambiente. Com o desenvolvimento tecnológico, o sequenciamento de nova geração (NGS) tem trazido avanços no entendimento de características complexas no melhoramento animal, com o sequenciamento completo do genoma dos animais domésticos foi possível melhor entender como variantes causais e estruturais tem influenciado o fenótipo. Com o uso do NGS é possível quantificar o mRNA que está sendo expresso de um determinado gene que influencia determinada característica (transcriptoma – RNA-Seq), descobrir alterações epigenéticas (ChIP-Seq) e, então, conhecer melhor os mecanismos moleculares que modulam a característica e tecido em questão; aumentar a densidade de marcadores de nucleotídeos simples (SNP) com o sequenciamento do genoma completo (WGS) e então, descobrir associações genômicas mais significativas e mais precisas. Com o advento do NGS veio a necessidade de o desenvolvimento poder computacional e novas ferramentas capazes de analisar e armazenar a quantidade de dados gerada. Em função disso, o desenvolvimento de softwares capazes de realizar o controle de qualidade, mapeamento das sequencias contra o genoma de referencia e, quantificar os transcritos (no caso de RNA- Seq) tem se tornado necessário e, lidar com esse tipo de análise pode ser difícil para aqueles que não tem familiaridade com sistemas computacionais. Visto isso foi desenvolvido um pipeline de uso amigável para analisar dados de RNA-Seq, realizando controle de qualidade, mapeamento e contagem de sequencias. O BAQCOM (Bioinformatics Analysis of Quality Control and Mapping) tem se mostrado eficiente e rápido. Utilizando dados de RNA-Seq objetivou-se conhecer o perfil global de expressão gênica envolvido em Condronecrose Bacteriana com Osteomielite em frangos (BCO), que é desenvolvida nas placas de crescimento ósseo do fêmur e tíbia e colonizada por bactérias oportunistas. Utilizando amostras de tíbia de seis frangos de linhagem comercial (três afetados por BCO e três sadios), foram encontrados 192 genes diferencialmente expressos (FDR < 0.05) divididos em 63 upregulados e 129 downregulados. 26 genes e sete fatores de transcrição foram encontrados downregulados explicando BCO em tíbia, podendo concluir que a BCO em frangos pode ser causada pela baixa expressão de genes relacionados ao crescimento ósseo e, que, a proliferação bacteriana parece ser um processo secundário. Outro cenário para o uso de NGS é o mapeamento fino de região de QTL (quantitative Traits Loci). Uma região de QTL no cromossomo 5 associada com espessura de toucinho foi encontrada em quatro linhagens comercial de suínos (sintético baseado em large-white, Pietrain, Landrace e Large-White). Espessura de toucinho é importante para eficiência alimentar e qualidade de carne, além de ser reservatório energético. Embora Genome Wide Association Study (GWAS) tem sido amplamente usada associada à fenótipos, ainda há a necessidade de reduzir a região de associação se o objetivo é achar mutações causais. Por essa razão objetivou-se reduzir esta região de QTL usando dados de WGS, RNA-Seq e ChIP-Seq. A partir do SNP mais significativo do GWAS (leadSNP – SSC5:66103958), os haplótipos foram postos em fase e selecionados haplótipos de tamanho 41 SNPs (20 < leadSNP > 20). Foi selecionado o haplótipo mais frequente entre as linhagens utilizadas, então foi possível identificar uma região de 5 SNPs (2 < leadSNP > 2) presente em todas as linhagens. A partir desta região foi realizado o mapeamento fino, primeiro foi utilizado WGS e foi identificado três variantes candidatas (SSC5:66097445, SSC5:66099282 e SSC5c66103958). Nesta região entre SSC5:66097445-66103958 foram encontradas marcas epigenéticas H3K27me3 e H3K4me3 utilizado dados de ChIP-Seq de macrófagos alveolar de suínos, indicando regulação de expressão gênica durante período de desenvolvimento pre-natal. Em função disso foram utilizados RNA-Seq de embriões e fetos, onde foi possível encontrar alta expressão do gene CCND2, que está relacionado ao desenvolvimento e diferenciação de tecido adiposo, sendo um forte candidato a gene causal para espessura de toucinho. É possível, também, concluir que nesta região pode ter elementos regulatórios envolvidos na expressão do gene CCND2 no desenvolvimento embrionário e que, o impacto epigenético durante a vida embrionária pode impactar a produção de características na vida adulta. Nessa tese foi usado dados de sequenciamento, genotipagem, fenótipo, transcriptoma e ChIP-Seq, integrando todos para estreitar regiões de interesse no genoma, assim, resultando e propondo ferramentas para melhorar o melhoramento animal no futuro. Palavras-chave: Genômica. Sequenciamento de Genoma Completo. Transcriptoma. ChIP- Seq. Fenótipo.
publishDate 2020
dc.date.issued.fl_str_mv 2020-09-30
dc.date.accessioned.fl_str_mv 2022-07-22T12:24:10Z
dc.date.available.fl_str_mv 2022-07-22T12:24:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OLIVEIRA, Haniel Cedraz de. Applying next generation sequence data in animal breeding. 2020. 85 f. Tese (Doutorado em Zootecnia) - Universidade Federal de Viçosa, Viçosa. 2020.
dc.identifier.uri.fl_str_mv https://locus.ufv.br//handle/123456789/29393
identifier_str_mv OLIVEIRA, Haniel Cedraz de. Applying next generation sequence data in animal breeding. 2020. 85 f. Tese (Doutorado em Zootecnia) - Universidade Federal de Viçosa, Viçosa. 2020.
url https://locus.ufv.br//handle/123456789/29393
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Zootecnia
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/29393/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/29393/2/license.txt
bitstream.checksum.fl_str_mv 6d5bb42e3b4ec02321568df57bb232a7
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1801213103241691136