Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | http://www.locus.ufv.br/handle/123456789/6490 |
Resumo: | Os parasitos do gênero Leishmania, que causam um amplo espectro de desordens clínicas referidas comumente como leishmanioses, são um grande problema de saúde pública em vários países. A leishmaniose tegumentar americana está entre as endemias de maior importância em saúde pública no Brasil, devido a fatores como: ampla distribuição pelo território nacional, ocorrência de formas clínicas graves e limitações referentes tanto ao diagnóstico como ao tratamento, sendo a L. (V.) braziliensis uma das principais espécies de importância epidemiológica para a LTA no Brasil. Atualmente existem diversas tecnologias que permitem o sequenciamento do DNA em larga escala, sendo a plataforma 454/Roche utilizada neste trabalho. Assim, este trabalho utilizou ferramentas de bioinformática para montar e analisar o transcriptoma de L. (V.) braziliensis através do sequenciamento do transcriptoma de dois isolados (ET e NSL), que apresentam diferença significativa na virulência em modelo murino. Foram preparadas duas formas evolutivas para cada isolado: metacíclica (MET) e procíclica (PRO). Desta forma foram analisadas quatro bibliotecas. Após sequenciamento, os dados foram visualizados com o programa fastQC, tratados com FASTX- Tollkit e Prinseq-Lite e montados com programa Newbler. A montagem (Assembly) foi efetuada de duas maneiras distintas: primeiro efetuou-se a montagem com as reads de cada biblioteca e posteriormente, as reads das quatro bibliotecas foram alocados em arquivo único para realização de um novo assembly. As open reading frame (ORFs), que são regiões com potencial para codificar proteínas, foram preditas utilizando as sequências resultantes da montagem. A anotação foi efetuada através de duas abordagens: transferência de informações do genoma anotado automaticamente para as ORFs preditas e pela abordagem baseada em homologia de sequências através da ferramenta de anotação funcional Blast2GO. Após anotação, efetuou-se a análise da expressão gênica diferencial através de duas abordagens diferentes: a primeira, utilizou o método de Blind do pacote DESeq do R/Bioconductor e a segunda utilizou uma abordagem baseada em RPKM. Foram produzidas 3.095.724 reads, sendo 916.546, 589.554, 1.083.312 e 506.312 sequências para ET-MET (biblioteca 1), ET- PRO (biblioteca 2), NSL-MET (biblioteca 3) e NSL-PRO (biblioteca 4), respectivamente. Após o tratamento, utilizou-se para o restante das análises 2.899.230 sequências. Com o intuito de validar algumas das análises, foi utilizado neste trabalho um segundo conjunto de reads (Illumina) baixado do banco de dados SRA (Sequence Read Archive) indexado ao NCBI, sendo este composto por 52.014.768 de reads paired end. Após o tratamento, utilizou- se para o restante das análises 47.377.233 de reads. Os resultados das análises com as reads sequenciadas neste trabalho e com os contigs montados, tal como o mapeamento destes no genoma anotado de L. (V.) braziliensis, produziu novas informações ao orfeoma anotado automaticamente de L. (V.) braziliensis. Após montagem, obteve-se 14.362, 13.145, 14.899 e 11.434 contigs maiores que 100 pb para as bibliotecas 1, 2, 3 e 4, respectivamente. Obteve-se como resultado da montagem, considerando as reads de todas as bibliotecas, 14.017 contigs. As ORFs preditas à partir dos contigs que não mapearam no genoma anotado foram utilizados para busca de novos genes de L. (V.) braziliensis. Como resultado, foi possível encontrar seis novos genes, 117 possíveis ORFs sem hits no banco de dados nr e 85 ORFs que, por algum motivo, deixaram de fazer parte do genoma anotado. Foram encontrados, ao se comparar as reads obtidas neste trabalho com o genoma anotado, 6.293 sítios com identidades diferentes, que pode ser devido a divergência alélica entre os isolados analisados ou devido ao polimorfismos de nucleotídeo único (SNPs). |
id |
UFV_cc612af6ef6929300c29a45676c29064 |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/6490 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Silva Júnior, AbelardoBressan, Gustavo CostaLamego, Márcia Rogéria de AlmeidaAfonso, Luís Carlos CroccoMaciel, Talles Eduardo Ferreirahttp://lattes.cnpq.br/3491513954357544Fietto, Juliana Lopes Rangel2015-11-03T13:28:34Z2015-11-03T13:28:34Z2014-02-10MACIEL, Talles Eduardo Ferreira. Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos. 2014. 92 f. Tese (Doutorado em Bioquímica Agrícola) - Universidade Federal de Viçosa, Viçosa. 2014.http://www.locus.ufv.br/handle/123456789/6490Os parasitos do gênero Leishmania, que causam um amplo espectro de desordens clínicas referidas comumente como leishmanioses, são um grande problema de saúde pública em vários países. A leishmaniose tegumentar americana está entre as endemias de maior importância em saúde pública no Brasil, devido a fatores como: ampla distribuição pelo território nacional, ocorrência de formas clínicas graves e limitações referentes tanto ao diagnóstico como ao tratamento, sendo a L. (V.) braziliensis uma das principais espécies de importância epidemiológica para a LTA no Brasil. Atualmente existem diversas tecnologias que permitem o sequenciamento do DNA em larga escala, sendo a plataforma 454/Roche utilizada neste trabalho. Assim, este trabalho utilizou ferramentas de bioinformática para montar e analisar o transcriptoma de L. (V.) braziliensis através do sequenciamento do transcriptoma de dois isolados (ET e NSL), que apresentam diferença significativa na virulência em modelo murino. Foram preparadas duas formas evolutivas para cada isolado: metacíclica (MET) e procíclica (PRO). Desta forma foram analisadas quatro bibliotecas. Após sequenciamento, os dados foram visualizados com o programa fastQC, tratados com FASTX- Tollkit e Prinseq-Lite e montados com programa Newbler. A montagem (Assembly) foi efetuada de duas maneiras distintas: primeiro efetuou-se a montagem com as reads de cada biblioteca e posteriormente, as reads das quatro bibliotecas foram alocados em arquivo único para realização de um novo assembly. As open reading frame (ORFs), que são regiões com potencial para codificar proteínas, foram preditas utilizando as sequências resultantes da montagem. A anotação foi efetuada através de duas abordagens: transferência de informações do genoma anotado automaticamente para as ORFs preditas e pela abordagem baseada em homologia de sequências através da ferramenta de anotação funcional Blast2GO. Após anotação, efetuou-se a análise da expressão gênica diferencial através de duas abordagens diferentes: a primeira, utilizou o método de Blind do pacote DESeq do R/Bioconductor e a segunda utilizou uma abordagem baseada em RPKM. Foram produzidas 3.095.724 reads, sendo 916.546, 589.554, 1.083.312 e 506.312 sequências para ET-MET (biblioteca 1), ET- PRO (biblioteca 2), NSL-MET (biblioteca 3) e NSL-PRO (biblioteca 4), respectivamente. Após o tratamento, utilizou-se para o restante das análises 2.899.230 sequências. Com o intuito de validar algumas das análises, foi utilizado neste trabalho um segundo conjunto de reads (Illumina) baixado do banco de dados SRA (Sequence Read Archive) indexado ao NCBI, sendo este composto por 52.014.768 de reads paired end. Após o tratamento, utilizou- se para o restante das análises 47.377.233 de reads. Os resultados das análises com as reads sequenciadas neste trabalho e com os contigs montados, tal como o mapeamento destes no genoma anotado de L. (V.) braziliensis, produziu novas informações ao orfeoma anotado automaticamente de L. (V.) braziliensis. Após montagem, obteve-se 14.362, 13.145, 14.899 e 11.434 contigs maiores que 100 pb para as bibliotecas 1, 2, 3 e 4, respectivamente. Obteve-se como resultado da montagem, considerando as reads de todas as bibliotecas, 14.017 contigs. As ORFs preditas à partir dos contigs que não mapearam no genoma anotado foram utilizados para busca de novos genes de L. (V.) braziliensis. Como resultado, foi possível encontrar seis novos genes, 117 possíveis ORFs sem hits no banco de dados nr e 85 ORFs que, por algum motivo, deixaram de fazer parte do genoma anotado. Foram encontrados, ao se comparar as reads obtidas neste trabalho com o genoma anotado, 6.293 sítios com identidades diferentes, que pode ser devido a divergência alélica entre os isolados analisados ou devido ao polimorfismos de nucleotídeo único (SNPs).Parasites of the genus Leishmania, which cause a broad spectrum of clinical disorders referred to commonly as leishmaniasis, are a major public health problem in many countries. American cutaneous leishmaniasis is among the endemic most important in public health in Brazil, due to factors such as: wide distribution throughout the country, the occurrence of severe clinical forms and limitations relating to both diagnosis and treatment, with L. (V.) braziliensis being one of the main species of epidemiological significance to the LTA in Brazil. Currently there are several technologies that allow the DNA sequencing in large scale, being the 454/Roche platform used in this work. Thus, this study used bioinformatics tools for assembly and analyze the transcriptome of L. (V.) braziliensis through transcriptome sequencing of two isolates (ET and NSL), which present significant difference in virulence in murine model. Were prepared two evolutionary forms for each isolate: metacyclic (MET) and procyclical (PRO). Thus, four libraries were analyzed. After sequencing, the data were visualized with fastQC program, treated with FASTX-Tollkit and Prinseq-Lite and assembly with Newbler v.2.5.3 program. The assembly was conducted of two distinct ways: first performed the assembly whit the reads from each sample and then, the reads of the four samples were placed in single file to perform a new assembly. The open reading frame (ORF), which are regions with potential to encode a protein were predicted using the resulting assembly. The annotation was carried out using two approaches: transfer of information of automatically annotated genomic to predicted ORFs and by approach based on sequence homology by functional annotation tool Blast2GO. After annotation, performed the analysis of differential gene expression by two different approaches: first, was used the Blind method of DESeq package the R/Bioconductor and the second was used an approach based on RPKM. 3.095.724 reads were produced, with 916.546, 589.554, 1.083.312 and 506.312 sequences for ET-MET (sample 1), ET-PRO (sample 2), NSL-MET (sample 3) and NSL- PRO (sample 4), respectively. After treatment, was used for the remaining analysis 2.899.230 sequence. In order to validate some of the analysis, was used in this study, a second set of reads (Illumina) downloaded from the database SRA (Archive Sequence Read) indexed to NCBI, this being composed of 52.014.768 of reads paired end. After treatment, was used for the remainder analysis 47.377.233 of reads. The results of the analysis with the reads sequenced this work and with the assembly contigs, such as mapping of these in annotated genome the L. (V.) braziliensis, produced new information to automatically annotated orfeoma of L. (V.) braziliensis. After assembly, we obtained 14.362, 13.145, 14.899 and 11.434 contigs larger than 100 bp for samples 1, 2, 3 and 4, respectively. It was obtained as a result of assembly, considering the reads from all samples, 14.017 contigs. The ORFs predicted from contigs not mapped the annotated genome were used to search for new genes of L. (V.) braziliensis. So, were found six new genes, 117 ORFs possible without hits in the nr database and 85 ORFs that, for some reason, no longer in the annotated genome. Were found, when comparing the reads obtained in this work with the annotated genome, 6.293 sites with different identities, which may be due to the allelic divergence between the isolates analyzed or due to single nucleotide polymorphisms (SNPs).Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de ViçosaLeishmania braziliensisBioinformáticaExpressão diferencialTranscriptomaBiologia MolecularBioquímicaTranscriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressosTranscriptome of L. (V.) braziliensis by RNA-Seq: assembly of transcriptomas, enrichment of orfeoma, expression analysis and annotation of differentially expressed genesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal de ViçosaDepartamento de Bioquímica e Biologia MolecularDoutor em Bioquímica AgrícolaViçosa - MG2014-02-10Doutoradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf2083437https://locus.ufv.br//bitstream/123456789/6490/1/texto%20completo.pdf8f479543c8dc090087a91955c71d8ba0MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/6490/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain170422https://locus.ufv.br//bitstream/123456789/6490/3/texto%20completo.pdf.txt391030eaf694ce2db2d839db03446e4cMD53THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3728https://locus.ufv.br//bitstream/123456789/6490/4/texto%20completo.pdf.jpg19d24cfdf9ffd748d1f70934aa4c71b7MD54123456789/64902016-04-12 23:03:47.937oai:locus.ufv.br:123456789/6490Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-13T02:03:47LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.pt-BR.fl_str_mv |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos |
dc.title.en.fl_str_mv |
Transcriptome of L. (V.) braziliensis by RNA-Seq: assembly of transcriptomas, enrichment of orfeoma, expression analysis and annotation of differentially expressed genes |
title |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos |
spellingShingle |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos Maciel, Talles Eduardo Ferreira Leishmania braziliensis Bioinformática Expressão diferencial Transcriptoma Biologia Molecular Bioquímica |
title_short |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos |
title_full |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos |
title_fullStr |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos |
title_full_unstemmed |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos |
title_sort |
Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos |
author |
Maciel, Talles Eduardo Ferreira |
author_facet |
Maciel, Talles Eduardo Ferreira |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
http://lattes.cnpq.br/3491513954357544 |
dc.contributor.none.fl_str_mv |
Silva Júnior, Abelardo Bressan, Gustavo Costa Lamego, Márcia Rogéria de Almeida Afonso, Luís Carlos Crocco |
dc.contributor.author.fl_str_mv |
Maciel, Talles Eduardo Ferreira |
dc.contributor.advisor1.fl_str_mv |
Fietto, Juliana Lopes Rangel |
contributor_str_mv |
Fietto, Juliana Lopes Rangel |
dc.subject.pt-BR.fl_str_mv |
Leishmania braziliensis Bioinformática Expressão diferencial Transcriptoma |
topic |
Leishmania braziliensis Bioinformática Expressão diferencial Transcriptoma Biologia Molecular Bioquímica |
dc.subject.cnpq.fl_str_mv |
Biologia Molecular Bioquímica |
description |
Os parasitos do gênero Leishmania, que causam um amplo espectro de desordens clínicas referidas comumente como leishmanioses, são um grande problema de saúde pública em vários países. A leishmaniose tegumentar americana está entre as endemias de maior importância em saúde pública no Brasil, devido a fatores como: ampla distribuição pelo território nacional, ocorrência de formas clínicas graves e limitações referentes tanto ao diagnóstico como ao tratamento, sendo a L. (V.) braziliensis uma das principais espécies de importância epidemiológica para a LTA no Brasil. Atualmente existem diversas tecnologias que permitem o sequenciamento do DNA em larga escala, sendo a plataforma 454/Roche utilizada neste trabalho. Assim, este trabalho utilizou ferramentas de bioinformática para montar e analisar o transcriptoma de L. (V.) braziliensis através do sequenciamento do transcriptoma de dois isolados (ET e NSL), que apresentam diferença significativa na virulência em modelo murino. Foram preparadas duas formas evolutivas para cada isolado: metacíclica (MET) e procíclica (PRO). Desta forma foram analisadas quatro bibliotecas. Após sequenciamento, os dados foram visualizados com o programa fastQC, tratados com FASTX- Tollkit e Prinseq-Lite e montados com programa Newbler. A montagem (Assembly) foi efetuada de duas maneiras distintas: primeiro efetuou-se a montagem com as reads de cada biblioteca e posteriormente, as reads das quatro bibliotecas foram alocados em arquivo único para realização de um novo assembly. As open reading frame (ORFs), que são regiões com potencial para codificar proteínas, foram preditas utilizando as sequências resultantes da montagem. A anotação foi efetuada através de duas abordagens: transferência de informações do genoma anotado automaticamente para as ORFs preditas e pela abordagem baseada em homologia de sequências através da ferramenta de anotação funcional Blast2GO. Após anotação, efetuou-se a análise da expressão gênica diferencial através de duas abordagens diferentes: a primeira, utilizou o método de Blind do pacote DESeq do R/Bioconductor e a segunda utilizou uma abordagem baseada em RPKM. Foram produzidas 3.095.724 reads, sendo 916.546, 589.554, 1.083.312 e 506.312 sequências para ET-MET (biblioteca 1), ET- PRO (biblioteca 2), NSL-MET (biblioteca 3) e NSL-PRO (biblioteca 4), respectivamente. Após o tratamento, utilizou-se para o restante das análises 2.899.230 sequências. Com o intuito de validar algumas das análises, foi utilizado neste trabalho um segundo conjunto de reads (Illumina) baixado do banco de dados SRA (Sequence Read Archive) indexado ao NCBI, sendo este composto por 52.014.768 de reads paired end. Após o tratamento, utilizou- se para o restante das análises 47.377.233 de reads. Os resultados das análises com as reads sequenciadas neste trabalho e com os contigs montados, tal como o mapeamento destes no genoma anotado de L. (V.) braziliensis, produziu novas informações ao orfeoma anotado automaticamente de L. (V.) braziliensis. Após montagem, obteve-se 14.362, 13.145, 14.899 e 11.434 contigs maiores que 100 pb para as bibliotecas 1, 2, 3 e 4, respectivamente. Obteve-se como resultado da montagem, considerando as reads de todas as bibliotecas, 14.017 contigs. As ORFs preditas à partir dos contigs que não mapearam no genoma anotado foram utilizados para busca de novos genes de L. (V.) braziliensis. Como resultado, foi possível encontrar seis novos genes, 117 possíveis ORFs sem hits no banco de dados nr e 85 ORFs que, por algum motivo, deixaram de fazer parte do genoma anotado. Foram encontrados, ao se comparar as reads obtidas neste trabalho com o genoma anotado, 6.293 sítios com identidades diferentes, que pode ser devido a divergência alélica entre os isolados analisados ou devido ao polimorfismos de nucleotídeo único (SNPs). |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014-02-10 |
dc.date.accessioned.fl_str_mv |
2015-11-03T13:28:34Z |
dc.date.available.fl_str_mv |
2015-11-03T13:28:34Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
MACIEL, Talles Eduardo Ferreira. Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos. 2014. 92 f. Tese (Doutorado em Bioquímica Agrícola) - Universidade Federal de Viçosa, Viçosa. 2014. |
dc.identifier.uri.fl_str_mv |
http://www.locus.ufv.br/handle/123456789/6490 |
identifier_str_mv |
MACIEL, Talles Eduardo Ferreira. Transcriptoma de Leishmania (V.) braziliensis por RNA-Seq: montagem de transcriptomas, enriquecimento de orfeoma, análise de expressão e anotação dos genes diferencialmente expressos. 2014. 92 f. Tese (Doutorado em Bioquímica Agrícola) - Universidade Federal de Viçosa, Viçosa. 2014. |
url |
http://www.locus.ufv.br/handle/123456789/6490 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/6490/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/6490/2/license.txt https://locus.ufv.br//bitstream/123456789/6490/3/texto%20completo.pdf.txt https://locus.ufv.br//bitstream/123456789/6490/4/texto%20completo.pdf.jpg |
bitstream.checksum.fl_str_mv |
8f479543c8dc090087a91955c71d8ba0 8a4605be74aa9ea9d79846c1fba20a33 391030eaf694ce2db2d839db03446e4c 19d24cfdf9ffd748d1f70934aa4c71b7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801212915843334144 |