Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania

Detalhes bibliográficos
Autor(a) principal: Ruy, Patrícia de Cássia
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/
Resumo: Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global.
id USP_c5f5ad164c8dabcdc9c23e679f26219f
oai_identifier_str oai:teses.usp.br:tde-21112017-112651
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em LeishmaniaIn silico identification and analysis of Leishmania ncRNAs using RNA-seq dataBioinformáticaBioinformaticsLeishmaniaLeishmaniaNcRNANcRNANon-coding RNARNA não codificadorRNA-seqRNA-seqTranscriptomaTranscriptomeAnálises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global.High-throughput data analyses indicated that transcriptomes are more extensive and complex than previously supposed. Currently, it is evident that most eukaryotic genomes are almost entirely transcribed and under regulation tied to developmental stages. Control of gene expression involves regulatory non-coding RNAs (ncRNAs), including post-transcriptional processes. Post-transcriptional regulation is particularly relevant for the regulation of gene expression in trypanosomatids, as compared to other organisms. Parasites of the genus Leishmania (Order Kinetoplastidae, family Trypanosomatidae) causes infectious-parasitic diseases known as leishmaniasis, and their life cycle comprises three development stages: procyclic promastigotes, metacyclic promastigotes and amastigotes. This study aimed to computationally identify and characterize Leishmania putative ncRNAs at different stages of development. Large-scale approaches combined with bioinformatics tools allowed the identification of 11,376 putative ncRNAs in L. braziliensis and, in a preliminary study, of 37 putative ncRNAs in L. donovani. In addition, the L. braziliensis the complete transcriptome was analyzed comparatively between the parasite development stages. In L. donovani, of the 37 putative ncRNAs identified, 34 were in UTRs (Untranslated Regions) and 3 in intergenic regions. Predictors of ncRNAs specific characteristics were used and 32 putative ncRNAs had at least one positive prediction. All candidates are conserved, partially or entirely, in at least three Leishmania species. Five L. donovani ncRNAs were confirmed by Northern blotting experiments. Analysis of the L. braziliensis transcriptome revealed differences in gene expression levels between developmental stages, ranging from 52% to 71%, depending on the compared stages. The boundaries of the 5\'UTRs and 3\'UTRs were also defined for 81% and 38% of the annotated CDSs, respectively. We developed a methodology for the identification of putative ncRNAs using total RNA sequencing data. This methodology allowed the identification of 11,376 putative ncRNAs in L. braziliensis, and all candidates were analyzed by predictive programs of ncRNAs specific characteristics and presented at least one positive prediction, in addition to bearing no similarity to known protein domains. The analysis showed that from 27% to 41% of the putative ncRNAs identified are conserved in other Leishmania species. We found 27% to 38% of putative ncRNAs with regulation associated to the developmental stage, depending on the compared stages. Consequently, besides identification and characterization of ncRNAs in Leishmania, candidates with developmental-related regulation were found and patterns were uncovered with the proposed and implemented analysis. Thus, this work contributes significantly to improve understanding of gene expression regulation processes in Leishmania and will offer to the community important information about the parasite genetics and regulatory differences along the development, besides of L. braziliensis transcriptome information.Biblioteca Digitais de Teses e Dissertações da USPCruz, Angela KayselRuy, Patrícia de Cássia2017-08-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-04-23T16:00:05Zoai:teses.usp.br:tde-21112017-112651Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-04-23T16:00:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
In silico identification and analysis of Leishmania ncRNAs using RNA-seq data
title Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
spellingShingle Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
Ruy, Patrícia de Cássia
Bioinformática
Bioinformatics
Leishmania
Leishmania
NcRNA
NcRNA
Non-coding RNA
RNA não codificador
RNA-seq
RNA-seq
Transcriptoma
Transcriptome
title_short Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_full Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_fullStr Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_full_unstemmed Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
title_sort Identificação e análise in silico de ncRNAs empregando dados de RNA-seq em Leishmania
author Ruy, Patrícia de Cássia
author_facet Ruy, Patrícia de Cássia
author_role author
dc.contributor.none.fl_str_mv Cruz, Angela Kaysel
dc.contributor.author.fl_str_mv Ruy, Patrícia de Cássia
dc.subject.por.fl_str_mv Bioinformática
Bioinformatics
Leishmania
Leishmania
NcRNA
NcRNA
Non-coding RNA
RNA não codificador
RNA-seq
RNA-seq
Transcriptoma
Transcriptome
topic Bioinformática
Bioinformatics
Leishmania
Leishmania
NcRNA
NcRNA
Non-coding RNA
RNA não codificador
RNA-seq
RNA-seq
Transcriptoma
Transcriptome
description Análises de dados gerados em larga escala revelaram que os transcriptomas são mais extensos e complexos do que inferido previamente. Hoje é evidente que a maioria dos genomas de eucariotos são quase inteiramente transcritos e sob regulação atrelada a estágios de desenvolvimento. O controle da expressão gênica envolve RNAs não codificadores (ncRNAs) regulatórios, inclusive em processos pós-transcricionais. A regulação de expressão gênica em nível pós-transcricional é crucial em diferentes organismos, mas é particularmente central nos tripanossomatídeos. Os parasitos do gênero Leishmania (Ordem Kinetoplastidae, família Trypanosomatidae) provocam doenças infecto-parasitárias conhecidas como leishmanioses e em seu ciclo de vida apresenta-se sob três formas principais de desenvolvimento: promastigotas procíclicos, promastigotas metacíclicos e os amastigotas. Este trabalho teve como objetivo identificar e caracterizar computacionalmente ncRNAs putativos de Leishmania em diferentes estágios de desenvolvimento. A associação de abordagens em larga escala e ferramentas de bioinformática possibilitaram a identificação de 11.376 ncRNAs putativos em L. braziliensis e, em um estudo preliminar, de 37 ncRNAs putativos em L. donovani. Adicionalmente, o transcriptoma de L. braziliensis foi analisado comparativamente entre os três estágios de desenvolvimento do parasito. Em L. donovani, dos 37 ncRNAs putativos identificados, 34 estavam em UTRs (Untranslated Regions) e 3 em regiões intergênicas. Preditores de características específicas de ncRNAs foram utilizados e 32 ncRNAs putativos tiveram pelo menos uma predição positiva. Todos os candidatos estão conservados inteira ou parcialmente em pelo menos 3 espécies de Leishmania. Cinco ncRNAs de L. donovani foram confirmados por experimentos de Northern blotting. A análise do transcriptoma de L. braziliensis revelou uma diferença de expressão gênica entre os estágios de desenvolvimento que variou entre 52% e 71%, dependendo dos estágios comparados. Também foram definidos os limites das 5UTRs e 3UTRs de 81% e 38% das CDSs anotadas, respectivamente. Propusemos uma metodologia para identificação de ncRNAs putativos utilizando dados de sequenciamento de RNA-total. Essa metodologia identificou 11.376 ncRNAs putativos em L. braziliensis, sendo que todos os candidatos foram analisados por programas preditores de características específicas de ncRNAs e apresentaram pelo menos uma predição positiva, além de não possuírem semelhança com domínios proteicos conhecidos. A análise de conservação demonstrou que de 27% a 41% dos ncRNAs putativos identificados são conservados em outras espécies de Leishmania. Foram encontrados de 27% a 38% de ncRNAs putativos com regulação atrelada ao estágio de desenvolvimento, dependendo dos estágios comparados. Assim, além da identificação e descrição de ncRNAs em Leishmania foram encontrados candidatos com regulação atrelada ao desenvolvimento e padrões foram descortinados com o processo de análise proposto e executado. Portanto, esse trabalho contribui significativamente para ampliar a compreensão dos processos de regulação de expressão gênica em Leishmania e oferecerá à comunidade um conjunto grande e importante de informações sobre a organização genética do parasito, diferenças genéticas e regulatórias ao longo do desenvolvimento, além de informações do transcriptoma de forma global.
publishDate 2017
dc.date.none.fl_str_mv 2017-08-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/
url http://www.teses.usp.br/teses/disponiveis/95/95131/tde-21112017-112651/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090970494435328