Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos

Detalhes bibliográficos
Autor(a) principal: Maia, Guilherme Augusto
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/254605
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Biotecnologia e Biociências, Florianópolis, 2023.
id UFSC_923c651d0e5983ca05c45b38d39b129a
oai_identifier_str oai:repositorio.ufsc.br:123456789/254605
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanosBiotecnologiaParasitosGenômicaBioinformáticaProteínasTese (doutorado) - Universidade Federal de Santa Catarina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Biotecnologia e Biociências, Florianópolis, 2023.Trypanosoma rangeli é um protozoário que ocorre nas Américas, que compartilha aspectos genéticos, morfológicos e antigênicos com T. cruzi, agente etiológico da Doença de Chagas. Apesar das características compartilhadas e da proximidade filogenética com o T. cruzi, o T. rangeli não é considerado patogênico para seu hospedeiro mamífero. Em comparação com o T. cruzi, o genoma do T. rangeli apresenta um número menor de cópias de genes que codificam para proteínas de superfície, as quais são possíveis fatores de virulência associados aos processos de invasão celular e evasão do sistema imune. Neste contexto, o objetivo do presente estudo foi gerar uma nova versão do genoma de T. rangeli (cepa SC58), combinando dados obtidos através de diferentes tecnologias de sequenciamento, e realizar um estudo comparativo de aspectos estruturais e funcionais com outras espécies de tripanosomatídeos. Para tal, foi realizada uma nova montagem genômica de T. rangeli utilizando dados de sequenciamento do tipo long reads e short reads. As etapas de predição gênica e anotação gênica foram realizadas utilizando-se o programa AnnotaPipeline, que utilizou dados experimentais de transcriptômica e proteômica para validar as predições gênicas de T. rangeli. Para a anotação gênica automática por análise de similaridade, foram utilizadas sequências depositadas nos bancos de dados do SwissProt e do TriTrypDB, também sendo realizadas anotação funcional, análise de evidência de transcrição e de evidência de tradução. Em seguida, foi realizada uma análise de homologia entre as CDS descritas na versão 2 do genoma de T. rangeli, as CDS de T. brucei (cepa TREU927) e de T. cruzi (cepa CL Brener Esmeraldo-like), assim como as CDS preditas e anotadas na montagem do genoma de T. conorhini (cepa 025E). Os resultados mostram que a versão 2 do genoma de T. rangeli SC58 é mais contígua, menos fragmentada e abrange 99,95% de toda a informação contida na descrição original do genoma do parasito. Nesta versão, o conteúdo genômico repetitivo de T. rangeli é representado por uma fração de 13,53% de elementos repetitivos estruturais e por apenas 2,74% de elementos repetitivos funcionais. Os elementos estruturais mais proeminentes são as repetições intercaladas (compostas principalmente por retroelementos do tipo LTRs e LINEs) e as repetições simples (com uma maior repetição de motivos de di-nucleotídeos). Os elementos funcionais que mais se destacam são os genes multicópias das famílias das sialidases e GP63, representando 44,67% e 38,42% do total identificado, respectivamente. A devida identificação destes elementos repetitivos no genoma possibilita um melhor entendimento sobre os processos de adaptação e evolução desses organismos. A atribuição de função por meio de anotação automática foi obtida para 73,12% das CDS preditas, restando apenas 26,88% das CDS anotadas como hipotéticas. Os resultados obtidos da análise de homologia reforçam a existência de um genoma central compartilhado entre tripanosomatídeos, representado por um agrupamento de 4.156 grupos de CDS ortólogas das quatro espécies estudadas. A versão 2 do genoma de T. rangeli SC58 apresenta um conjunto de CDS anotadas como hipotéticas a serem caracterizadas, principalmente as ortólogas com as demais espécies de tripanosomatídeos.Abstract: Trypanosoma rangeli is a protozoan that occurs in the Americas, sharing genetic, morphological, and antigenic aspects with T. cruzi, the etiological agent of Chagas disease. Despite the shared characteristics and phylogenetic proximity to T. cruzi, T. rangeli is not considered pathogenic to its mammalian host. Compared to T. cruzi, the genome of T. rangeli presents a smaller number of copies of genes encoding surface proteins, which are potential virulence factors associated with cellular invasion and immune system evasion processes. In this context, the aim of this study was to generate a new version of the T. rangeli genome (SC58 strain), combining data obtained through different sequencing technologies, and to conduct a comparative study of structural and functional aspects with other trypanosomatid species. To achieve this, a new genomic assembly of T. rangeli was performed using long-read and short-read sequencing data. Gene prediction and gene annotation steps were carried out using the AnnotaPipeline software, which used experimental transcriptomic and proteomic data to validate gene predictions of the genome. For automatic gene annotation by similarity analysis, sequences deposited in the SwissProt and TriTrypDB databases were used, along with functional annotation, transcription evidence analysis, and translation evidence analysis. Subsequently, a homology analysis was conducted among the CDS described in version 2 of the T. rangeli genome, the CDS of T. brucei (TREU927 strain) and T. cruzi (CL Brener Esmeraldo-like strain), as well as predicted and annotated CDS of the T. conorhini (025E strain) genome assembly. The results show that the version 2 of the T. rangeli SC58 genome is more contiguous, less fragmented, and covers 99.95% of all information contained in the original description of the parasite genome. In this version, the repetitive genomic content of T. rangeli is represented by a fraction of 13.53% structural repetitive elements and only 2.74% functional repetitive elements. The most prominent structural elements are interspersed repeats (composed mainly of LTRs and LINEs retroelements) and simple repeats (with a higher repetition of di-nucleotide motifs). The most representative functional elements are the multicopy genes of the sialidase and GP63 families, representing 44.67% and 38.42% of the total identified, respectively. The proper identification of these repetitive elements in the genome allows a better understanding of the processes of adaptation and evolution of these organisms. Function assignment by means of automatic annotation was obtained for 73.12% of the predicted CDS, leaving only 26.88% of the CDS annotated as hypothetical. Results obtained from the homology analysis reinforce the existence of a shared core genome among trypanosomatids, represented by a cluster of 4,156 groups of orthologous CDS from the four species studied. Version 2 of the T. rangeli SC58 genome presents a set of CDS annotated as hypothetical to be characterized, mainly the orthologs with the other trypanosomatid species.Wagner, GlauberGrisard, Edmundo CarlosUniversidade Federal de Santa CatarinaMaia, Guilherme Augusto2024-03-05T23:23:51Z2024-03-05T23:23:51Z2023info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis130 p.| gráfs., tabs.application/pdf386463https://repositorio.ufsc.br/handle/123456789/254605porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2024-03-05T23:23:51Zoai:repositorio.ufsc.br:123456789/254605Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732024-03-05T23:23:51Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
title Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
spellingShingle Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
Maia, Guilherme Augusto
Biotecnologia
Parasitos
Genômica
Bioinformática
Proteínas
title_short Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
title_full Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
title_fullStr Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
title_full_unstemmed Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
title_sort Nova versão do genoma de Trypanosoma rangeli isolado em Santa Catarina, Brasil: comparação de aspectos estruturais e funcionais com tripanosomatídeos patogênicos a humanos
author Maia, Guilherme Augusto
author_facet Maia, Guilherme Augusto
author_role author
dc.contributor.none.fl_str_mv Wagner, Glauber
Grisard, Edmundo Carlos
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Maia, Guilherme Augusto
dc.subject.por.fl_str_mv Biotecnologia
Parasitos
Genômica
Bioinformática
Proteínas
topic Biotecnologia
Parasitos
Genômica
Bioinformática
Proteínas
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro de Ciências Biológicas, Programa de Pós-Graduação em Biotecnologia e Biociências, Florianópolis, 2023.
publishDate 2023
dc.date.none.fl_str_mv 2023
2024-03-05T23:23:51Z
2024-03-05T23:23:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 386463
https://repositorio.ufsc.br/handle/123456789/254605
identifier_str_mv 386463
url https://repositorio.ufsc.br/handle/123456789/254605
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 130 p.| gráfs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652417334509568