Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/ |
Resumo: | Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global. |
id |
USP_c5f5ad164c8dabcdc9c23e679f26219f |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-21112017-112651 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em LeishmaniaIn silico identification and analysis of Leishmania ncRNAs using RNA-seq dataBioinformáticaBioinformaticsLeishmaniaLeishmaniaNcRNANcRNANon-coding RNARNA não codificadorRNA-seqRNA-seqTranscriptomaTranscriptomeAnálises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global.High-throughput data analyses indicated that transcriptomes are more extensive and complex than previously supposed. Currently, it is evident that most eukaryotic genomes are almost entirely transcribed and under regulation tied to developmental stages. Control of gene expression involves regulatory non-coding RNAs (ncRNAs), including post-transcriptional processes. Post-transcriptional regulation is particularly relevant for the regulation of gene expression in trypanosomatids, as compared to other organisms. Parasites of the genus Leishmania (Order Kinetoplastidae, family Trypanosomatidae) causes infectious-parasitic diseases known as leishmaniasis, and their life cycle comprises three development stages: procyclic promastigotes, metacyclic promastigotes and amastigotes. This study aimed to computationally identify and characterize Leishmania putative ncRNAs at different stages of development. Large-scale approaches combined with bioinformatics tools allowed the identification of 11,376 putative ncRNAs in L. braziliensis and, in a preliminary study, of 37 putative ncRNAs in L. donovani. In addition, the L. braziliensis the complete transcriptome was analyzed comparatively between the parasite development stages. In L. donovani, of the 37 putative ncRNAs identified, 34 were in UTRs (Untranslated Regions) and 3 in intergenic regions. Predictors of ncRNAs specific characteristics were used and 32 putative ncRNAs had at least one positive prediction. All candidates are conserved, partially or entirely, in at least three Leishmania species. Five L. donovani ncRNAs were confirmed by Northern blotting experiments. Analysis of the L. braziliensis transcriptome revealed differences in gene expression levels between developmental stages, ranging from 52% to 71%, depending on the compared stages. The boundaries of the 5\'UTRs and 3\'UTRs were also defined for 81% and 38% of the annotated CDSs, respectively. We developed a methodology for the identification of putative ncRNAs using total RNA sequencing data. This methodology allowed the identification of 11,376 putative ncRNAs in L. braziliensis, and all candidates were analyzed by predictive programs of ncRNAs specific characteristics and presented at least one positive prediction, in addition to bearing no similarity to known protein domains. The analysis showed that from 27% to 41% of the putative ncRNAs identified are conserved in other Leishmania species. We found 27% to 38% of putative ncRNAs with regulation associated to the developmental stage, depending on the compared stages. Consequently, besides identification and characterization of ncRNAs in Leishmania, candidates with developmental-related regulation were found and patterns were uncovered with the proposed and implemented analysis. Thus, this work contributes significantly to improve understanding of gene expression regulation processes in Leishmania and will offer to the community important information about the parasite genetics and regulatory differences along the development, besides of L. braziliensis transcriptome information.Biblioteca Digitais de Teses e Dissertações da USPCruz, Angela KayselRuy, Patrícia de Cássia2017-08-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-04-23T16:00:05Zoai:teses.usp.br:tde-21112017-112651Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-04-23T16:00:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania In silico identification and analysis of Leishmania ncRNAs using RNA-seq data |
title |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania |
spellingShingle |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania Ruy, Patrícia de Cássia Bioinformática Bioinformatics Leishmania Leishmania NcRNA NcRNA Non-coding RNA RNA não codificador RNA-seq RNA-seq Transcriptoma Transcriptome |
title_short |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania |
title_full |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania |
title_fullStr |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania |
title_full_unstemmed |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania |
title_sort |
Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania |
author |
Ruy, Patrícia de Cássia |
author_facet |
Ruy, Patrícia de Cássia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Cruz, Angela Kaysel |
dc.contributor.author.fl_str_mv |
Ruy, Patrícia de Cássia |
dc.subject.por.fl_str_mv |
Bioinformática Bioinformatics Leishmania Leishmania NcRNA NcRNA Non-coding RNA RNA não codificador RNA-seq RNA-seq Transcriptoma Transcriptome |
topic |
Bioinformática Bioinformatics Leishmania Leishmania NcRNA NcRNA Non-coding RNA RNA não codificador RNA-seq RNA-seq Transcriptoma Transcriptome |
description |
Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-08-08 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/ |
url |
http://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256563901792256 |