Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli

Detalhes bibliográficos
Autor(a) principal: Wagner, Glauber
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
Texto Completo: https://www.arca.fiocruz.br/handle/icict/36075
Resumo: O protozoário hemoflagelado Trypanosoma (Herpetosoma) rangeli Tejera, 1920, (Kinetoplastida: Trypanosomatidae) compartilha diversas espécies de hospedeiros invertebrados e vertebrados com T. cruzi, agente etiológico da doença de Chagas. Recentemente, foram publicados os genomas de 3 espécies de tripanosomatídeos de alta relevância em saúde humana (Tri-Tryps). Porém, espécies não-patogênicas não possuem o mesmo status, e como T. rangeli não determina nenhuma patogenia ao homem, poucos trabalhos no âmbito genômico tem sido desenvolvidos. Duas abordagens metodológicas têm sido utilizadas na busca de genes em diversas espécies, a GSS (Genome Sequence Survey) que visa a geração de seqüências de clones de DNA genômico gerados aleatoriamente e a EST (Expressed Sequence Tags) que visa a geração de seqüências a partir de bibliotecas de cDNA. Neste trabalho seqüenciamos 1.720 seqüências genômicas de T. rangeli cepa SC58 através de GSS. Foi também desenvolvido no âmbito do presente estudo um sistema de anotação de seqüências, chamado GARSA (Genomic Analysis Resources for Sequence Annotation). Neste sistema, é possível executar 21 programas de bioinformática, que vão desde a avaliação de qualidade e limpeza das seqüências até análise filogenética e domínios protêicos, numa forma simples e intuitiva. Após a limpeza dos 1.720 cromatogramas, um total de 915 seqüências foram agrupadas em 375 seqüências não redundantes (GSS-nr). O conteúdo G+C das regiões codificantes foi de 55%. Análises de similaridade utilizando os programas BLAST e Interpro, identificaram similaridade em 68% das seqüências, sendo 53% proteínas hipotéticas de organismos pertencentes à mesma família, notadamente o T. cruzi. Também foram encontradas seqüências associadas ao processo de edição de mRNA (DEAD box helicase), bem como seqüências relacionadas a superfície do parasito, como trans-sialidase, metaloproteases e mucinas Foram realizadas anotações funcionais baseadas no vocabulário proposto pelo Consórcio Gene Ontology, sendo que a maior parte das anotações dentro da categoria de função molecular está relacionada com RNA helicase, serino peptidases e proteínas ligantes. Para 31% das seqüências não foi possível inferir as funções com base na similaridade com genes já determinados, podendo estas serem seqüências ainda não determinadas, seqüências específicas de T. rangeli ou regiões intergências. Até o presente momento nenhum trabalho com a finalidade de seqüenciar o genoma de T. rangeli foi desenvolvido, portanto este trabalho pode ser considerado como o primeiro com o objetivo de explorar em maior escala o genoma desta espécie.
id CRUZ_4ded107bdd275c7e8737d1ca4b126d7d
oai_identifier_str oai:www.arca.fiocruz.br:icict/36075
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Wagner, GlauberGrisard, Edmundo CarlosorientadorDávila, Alberto Martin Rivera2019-10-02T14:00:28Z2019-10-02T14:00:28Z2006WAGNER, Glauber. Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli. 2006. 105 f. Dissertação (Mestrado em Biologia Celular e Molecular)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2006.https://www.arca.fiocruz.br/handle/icict/36075O protozoário hemoflagelado Trypanosoma (Herpetosoma) rangeli Tejera, 1920, (Kinetoplastida: Trypanosomatidae) compartilha diversas espécies de hospedeiros invertebrados e vertebrados com T. cruzi, agente etiológico da doença de Chagas. Recentemente, foram publicados os genomas de 3 espécies de tripanosomatídeos de alta relevância em saúde humana (Tri-Tryps). Porém, espécies não-patogênicas não possuem o mesmo status, e como T. rangeli não determina nenhuma patogenia ao homem, poucos trabalhos no âmbito genômico tem sido desenvolvidos. Duas abordagens metodológicas têm sido utilizadas na busca de genes em diversas espécies, a GSS (Genome Sequence Survey) que visa a geração de seqüências de clones de DNA genômico gerados aleatoriamente e a EST (Expressed Sequence Tags) que visa a geração de seqüências a partir de bibliotecas de cDNA. Neste trabalho seqüenciamos 1.720 seqüências genômicas de T. rangeli cepa SC58 através de GSS. Foi também desenvolvido no âmbito do presente estudo um sistema de anotação de seqüências, chamado GARSA (Genomic Analysis Resources for Sequence Annotation). Neste sistema, é possível executar 21 programas de bioinformática, que vão desde a avaliação de qualidade e limpeza das seqüências até análise filogenética e domínios protêicos, numa forma simples e intuitiva. Após a limpeza dos 1.720 cromatogramas, um total de 915 seqüências foram agrupadas em 375 seqüências não redundantes (GSS-nr). O conteúdo G+C das regiões codificantes foi de 55%. Análises de similaridade utilizando os programas BLAST e Interpro, identificaram similaridade em 68% das seqüências, sendo 53% proteínas hipotéticas de organismos pertencentes à mesma família, notadamente o T. cruzi. Também foram encontradas seqüências associadas ao processo de edição de mRNA (DEAD box helicase), bem como seqüências relacionadas a superfície do parasito, como trans-sialidase, metaloproteases e mucinas Foram realizadas anotações funcionais baseadas no vocabulário proposto pelo Consórcio Gene Ontology, sendo que a maior parte das anotações dentro da categoria de função molecular está relacionada com RNA helicase, serino peptidases e proteínas ligantes. Para 31% das seqüências não foi possível inferir as funções com base na similaridade com genes já determinados, podendo estas serem seqüências ainda não determinadas, seqüências específicas de T. rangeli ou regiões intergências. Até o presente momento nenhum trabalho com a finalidade de seqüenciar o genoma de T. rangeli foi desenvolvido, portanto este trabalho pode ser considerado como o primeiro com o objetivo de explorar em maior escala o genoma desta espécie.The hemoflagellate protozoan parasite Trypanosoma (Herpetosoma) rangeli Tejera, 1920 (Kinetoplastida: Tryponosomatidae) share several species of invertebrate and vertebrate hosts with T. cruzi, etiological agent of Chagas’ disease. Recently, the genome of 3 trypanosomatid species of major importance on human health (Tri-Tryps) were described but non-pathogenic species has not been well studied, among which we include T. rangeli. Two distinct approaches have been used on genomics of several species, the GSS (Genome Sequence Survey) which aims the generation of sequences from randomly generated genomic DNA clones and EST (Expressed Sequence Tags), directed to the generation of sequences from cDNA libraries. In the present study 1,720 genomic sequences from T. rangeli SC58 were generated by GSS. Furthermore, an integrated system for sequence analysis and annotation named GARSA (Genomic Analysis Resources for Sequence Annotation) was also developed. Through this system it is possible to run 21 bioinformatics softwares from simple sequence analysis and trimming to phylogenetic and protein domain analyses in a user-friendly and intuitive manner. After analysis of the 1,720 sequences, a total of 915 were grouped in 375 non-redundant sequences (GSS-nr). The G+C content of the coding regions was of 55%. Similarity searches based on BLAST and Interpro revealed positive for 68% of the sequences, being 53% hypothetical proteins of organisms belonging to the same family, especially T. cruzi. Also, sequences related to the mRNA editing process (DEAD box helicase), as well as from the parasite coat as trans-sialidase, metaloproteases and mucinas were found. Functional annotation based on the Gene Ontology consortia vocabulary were carried out, mostly related to molecular function and related to RNA helicase, serino-peptidases and ligands. For 31% of the generated sequences was not possible to infer functions based on similarity searches. Thus, these sequences may represent unknown sequences, T. rangeli specific sequences or even intergenic regions. Up to now there are no reports concerning the T. rangeli genome, indicating that the present work is the first one addressing a large scale exploration of the parasite genome.Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.porTrypanosomaDoença de ChagasTrypanosoma CruziTrypanosoma rangeliGSSGenomeAnnotationBioinformaticTrypanosoma RangeliGeração e análise comparativa de seqüências genômicas de Trypanossoma rangeliinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis2006Instituto Oswaldo CruzFundação Oswaldo CruzRio de JaneiroPrograma de Pós-Graduação em Biologia Celular e Molecularinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/36075/1/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALglauber_wagner_ioc_mest_2006.pdfapplication/pdf3596254https://www.arca.fiocruz.br/bitstream/icict/36075/2/glauber_wagner_ioc_mest_2006.pdf27018139c260d65d029459721d74b733MD52TEXTglauber_wagner_ioc_mest_2006.pdf.txtglauber_wagner_ioc_mest_2006.pdf.txtExtracted texttext/plain236072https://www.arca.fiocruz.br/bitstream/icict/36075/3/glauber_wagner_ioc_mest_2006.pdf.txt29bb0fb198b3be6084b620dfa5ac8487MD53icict/360752019-10-06 10:05:42.167oai:www.arca.fiocruz.br:icict/36075Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352019-10-06T13:05:42Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false
dc.title.pt_BR.fl_str_mv Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
title Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
spellingShingle Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
Wagner, Glauber
Trypanosoma
Doença de Chagas
Trypanosoma Cruzi
Trypanosoma rangeli
GSS
Genome
Annotation
Bioinformatic
Trypanosoma Rangeli
title_short Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
title_full Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
title_fullStr Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
title_full_unstemmed Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
title_sort Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli
author Wagner, Glauber
author_facet Wagner, Glauber
author_role author
dc.contributor.advisorco.none.fl_str_mv Grisard, Edmundo Carlosorientador
dc.contributor.author.fl_str_mv Wagner, Glauber
dc.contributor.advisor1.fl_str_mv Dávila, Alberto Martin Rivera
contributor_str_mv Dávila, Alberto Martin Rivera
dc.subject.other.pt_BR.fl_str_mv Trypanosoma
Doença de Chagas
Trypanosoma Cruzi
topic Trypanosoma
Doença de Chagas
Trypanosoma Cruzi
Trypanosoma rangeli
GSS
Genome
Annotation
Bioinformatic
Trypanosoma Rangeli
dc.subject.en.pt_BR.fl_str_mv Trypanosoma rangeli
GSS
Genome
Annotation
Bioinformatic
dc.subject.decs.pt_BR.fl_str_mv Trypanosoma Rangeli
description O protozoário hemoflagelado Trypanosoma (Herpetosoma) rangeli Tejera, 1920, (Kinetoplastida: Trypanosomatidae) compartilha diversas espécies de hospedeiros invertebrados e vertebrados com T. cruzi, agente etiológico da doença de Chagas. Recentemente, foram publicados os genomas de 3 espécies de tripanosomatídeos de alta relevância em saúde humana (Tri-Tryps). Porém, espécies não-patogênicas não possuem o mesmo status, e como T. rangeli não determina nenhuma patogenia ao homem, poucos trabalhos no âmbito genômico tem sido desenvolvidos. Duas abordagens metodológicas têm sido utilizadas na busca de genes em diversas espécies, a GSS (Genome Sequence Survey) que visa a geração de seqüências de clones de DNA genômico gerados aleatoriamente e a EST (Expressed Sequence Tags) que visa a geração de seqüências a partir de bibliotecas de cDNA. Neste trabalho seqüenciamos 1.720 seqüências genômicas de T. rangeli cepa SC58 através de GSS. Foi também desenvolvido no âmbito do presente estudo um sistema de anotação de seqüências, chamado GARSA (Genomic Analysis Resources for Sequence Annotation). Neste sistema, é possível executar 21 programas de bioinformática, que vão desde a avaliação de qualidade e limpeza das seqüências até análise filogenética e domínios protêicos, numa forma simples e intuitiva. Após a limpeza dos 1.720 cromatogramas, um total de 915 seqüências foram agrupadas em 375 seqüências não redundantes (GSS-nr). O conteúdo G+C das regiões codificantes foi de 55%. Análises de similaridade utilizando os programas BLAST e Interpro, identificaram similaridade em 68% das seqüências, sendo 53% proteínas hipotéticas de organismos pertencentes à mesma família, notadamente o T. cruzi. Também foram encontradas seqüências associadas ao processo de edição de mRNA (DEAD box helicase), bem como seqüências relacionadas a superfície do parasito, como trans-sialidase, metaloproteases e mucinas Foram realizadas anotações funcionais baseadas no vocabulário proposto pelo Consórcio Gene Ontology, sendo que a maior parte das anotações dentro da categoria de função molecular está relacionada com RNA helicase, serino peptidases e proteínas ligantes. Para 31% das seqüências não foi possível inferir as funções com base na similaridade com genes já determinados, podendo estas serem seqüências ainda não determinadas, seqüências específicas de T. rangeli ou regiões intergências. Até o presente momento nenhum trabalho com a finalidade de seqüenciar o genoma de T. rangeli foi desenvolvido, portanto este trabalho pode ser considerado como o primeiro com o objetivo de explorar em maior escala o genoma desta espécie.
publishDate 2006
dc.date.issued.fl_str_mv 2006
dc.date.accessioned.fl_str_mv 2019-10-02T14:00:28Z
dc.date.available.fl_str_mv 2019-10-02T14:00:28Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv WAGNER, Glauber. Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli. 2006. 105 f. Dissertação (Mestrado em Biologia Celular e Molecular)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2006.
dc.identifier.uri.fl_str_mv https://www.arca.fiocruz.br/handle/icict/36075
identifier_str_mv WAGNER, Glauber. Geração e análise comparativa de seqüências genômicas de Trypanossoma rangeli. 2006. 105 f. Dissertação (Mestrado em Biologia Celular e Molecular)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2006.
url https://www.arca.fiocruz.br/handle/icict/36075
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://www.arca.fiocruz.br/bitstream/icict/36075/1/license.txt
https://www.arca.fiocruz.br/bitstream/icict/36075/2/glauber_wagner_ioc_mest_2006.pdf
https://www.arca.fiocruz.br/bitstream/icict/36075/3/glauber_wagner_ioc_mest_2006.pdf.txt
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
27018139c260d65d029459721d74b733
29bb0fb198b3be6084b620dfa5ac8487
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1798324760274272256