Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos

Detalhes bibliográficos
Autor(a) principal: Coutinho, Vinicius Ramos Henriques Maracajá
Data de Publicação: 2013
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114634/
Resumo: Diversos estudos têm revelado que a maior parte das mensagens transcritas nos organismos superiores é composta por RNAs não codificadores de proteínas (ncRNAs). Os estudos finais do projeto ENCODE mostram que cerca de 75% das bases do genoma humano são transcritas. Nosso grupo vem estudando os RNAs longos (> 200 nt) não codificadores (RNAs TINs, RNAs totalmente intrônicos não codificadores e RNAs PIN, parcialmente intrônicos não codificadores) que potencialmente apresentam papéis regulatórios importantes nos genomas eucariotos. Embora vários estudos já tenham sido realizados a fim de elucidar suas funções, ainda há uma enorme escassez de informações ligadas à biologia destes transcritos, sendo necessária uma análise mais extensa e detalhada acerca de como eles são regulados e quais os seus papéis no universo celular. Neste trabalho realizamos uma extensa busca in silico em bancos de dados de ESTs públicas a fim de atualizarmos toda a evidência de atividade transcricional intrônica em 21 diferentes organismos eucariotos. Além disso, realizamos um estudo de expressão intrônica em fígado humano a partir de dados publicados na literatura, obtidos por duas técnicas de expressão gênica em larga-escala: microarranjos de cDNA com sondas intrônico-exônicas 44k e Massively Parallel Signature Sequencing (MPSS). Estes estudos de expressão permitiram identificar milhares de transcritos longos (> 200 nt) parcial ou totalmente intrônicos expressos no fígado humano. Posteriormente realizamos uma completa anotação destes RNAs baseada em homologia e estruturas secundárias evolutivamente conservadas e termodinamicamente estáveis, identificando quais deles seriam possíveis precursores de novas ou já conhecidas classes de ncRNAs. Também verificamos que RNAs não codificadores longos (lncRNAs) intrônicos e intergênicos humanos estão expressos em tecidos pancreáticos normais ou neoplásicos. Estes lncRNAs são transcritos em loci genômicos que estão enriquecidos com marcas de cromatina associadas a regiões promotoras, são conservados em outras espécies e apresentam estruturas secundárias conservadas e estáveis. Além disso, re-analizamos todo o repertório de ESTs públicas do parasita humano prostostomado Schistosoma mansoni, identificando uma variedade de potenciais novos ncRNAs e novos genes ainda não descritos para este organismo. Ainda desenvolvemos uma ferramenta web: NRDR – Noncoding RNA Databases Resource, um repositório online para recuperação de bancos de dados de ncRNAs disponíveis na rede. Também apresentamos o IntromeDB, uma base de dados pública referente a dados da literatura sobre expressão e caracterização deste tipo de ncRNAs intrônicos em organismos eucariotos, obtidos a partir dos mais variados tecidos e condições biológicas. Por fim, desenhamos duas novas plataformas customizadas Agilent de microarray 10 contendo 244 mil sondas para transcritos intrônicos, exônicos e intergênicos humanos. Os resultados obtidos deixam claro que os transcritos intrônicos apresentam diversos sinais biológicos que apontam para um tipo molecular funcional, e que as análises computacionais, em conjunto com estudos de expressão gênica em larga escala (p.ex. microarranjos, MPSS e sequenciadores de última geração), são importantes para o arsenal de ferramentas utilizadas na caracterização biológica destes transcritos.
id USP_e205a6c24a261969c6ff2f5a24946dd6
oai_identifier_str oai:teses.usp.br:tde-20230725-114634
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotosnot availableExpressão gênicaGenomasRNADiversos estudos têm revelado que a maior parte das mensagens transcritas nos organismos superiores é composta por RNAs não codificadores de proteínas (ncRNAs). Os estudos finais do projeto ENCODE mostram que cerca de 75% das bases do genoma humano são transcritas. Nosso grupo vem estudando os RNAs longos (> 200 nt) não codificadores (RNAs TINs, RNAs totalmente intrônicos não codificadores e RNAs PIN, parcialmente intrônicos não codificadores) que potencialmente apresentam papéis regulatórios importantes nos genomas eucariotos. Embora vários estudos já tenham sido realizados a fim de elucidar suas funções, ainda há uma enorme escassez de informações ligadas à biologia destes transcritos, sendo necessária uma análise mais extensa e detalhada acerca de como eles são regulados e quais os seus papéis no universo celular. Neste trabalho realizamos uma extensa busca in silico em bancos de dados de ESTs públicas a fim de atualizarmos toda a evidência de atividade transcricional intrônica em 21 diferentes organismos eucariotos. Além disso, realizamos um estudo de expressão intrônica em fígado humano a partir de dados publicados na literatura, obtidos por duas técnicas de expressão gênica em larga-escala: microarranjos de cDNA com sondas intrônico-exônicas 44k e Massively Parallel Signature Sequencing (MPSS). Estes estudos de expressão permitiram identificar milhares de transcritos longos (> 200 nt) parcial ou totalmente intrônicos expressos no fígado humano. Posteriormente realizamos uma completa anotação destes RNAs baseada em homologia e estruturas secundárias evolutivamente conservadas e termodinamicamente estáveis, identificando quais deles seriam possíveis precursores de novas ou já conhecidas classes de ncRNAs. Também verificamos que RNAs não codificadores longos (lncRNAs) intrônicos e intergênicos humanos estão expressos em tecidos pancreáticos normais ou neoplásicos. Estes lncRNAs são transcritos em loci genômicos que estão enriquecidos com marcas de cromatina associadas a regiões promotoras, são conservados em outras espécies e apresentam estruturas secundárias conservadas e estáveis. Além disso, re-analizamos todo o repertório de ESTs públicas do parasita humano prostostomado Schistosoma mansoni, identificando uma variedade de potenciais novos ncRNAs e novos genes ainda não descritos para este organismo. Ainda desenvolvemos uma ferramenta web: NRDR – Noncoding RNA Databases Resource, um repositório online para recuperação de bancos de dados de ncRNAs disponíveis na rede. Também apresentamos o IntromeDB, uma base de dados pública referente a dados da literatura sobre expressão e caracterização deste tipo de ncRNAs intrônicos em organismos eucariotos, obtidos a partir dos mais variados tecidos e condições biológicas. Por fim, desenhamos duas novas plataformas customizadas Agilent de microarray 10 contendo 244 mil sondas para transcritos intrônicos, exônicos e intergênicos humanos. Os resultados obtidos deixam claro que os transcritos intrônicos apresentam diversos sinais biológicos que apontam para um tipo molecular funcional, e que as análises computacionais, em conjunto com estudos de expressão gênica em larga escala (p.ex. microarranjos, MPSS e sequenciadores de última geração), são importantes para o arsenal de ferramentas utilizadas na caracterização biológica destes transcritos.Evidence suggesting that non-coding RNAs (ncRNAs) act as key components for the fine regulation of cellular processes has been accumulating in recent years. The final studies of the ENCODE project showed that around 75% of the bases of the human genome are transcribed. Our group has been studying long (> 200 nt) non-coding RNAs (RNAs TINS, totally intronic non-coding RNAs and PIN RNAs, partially intronic non-coding) that potentially have important regulatory roles in eukaryotic genomes. Although a number of studies have been conducted to elucidate their functions, there is still a huge lack of information related to the biology of these transcripts, and a more extensive and detailed analysis on how they are regulated and what are their actual roles in the cells is warranted. In this work, we performed an extensive in silico search of public ESTs databases in order to update all the evidence of intronic transcriptional activity in 21 different eukaryotic organisms. Furthermore, we conducted an expression analysis of intronic transcripts in human liver based on published datasets obtained with two techniques of large-scale gene expression measurements: intronic-exonic 44k microarrays and Massively Parallel Signature Sequencing (MPSS). These expression studies have identified thousands of long (> 200 nt) partially or totally intronic transcripts expressed in human liver. Subsequently we performed a complete annotation of these RNAs based on homology and on evolutionarily conserved secondary structures and thermodynamic stability, identifying which of them would be possible precursors of new or already known classes of ncRNAs. We also found that human long intronic and intergenic non- coding RNAs (lncRNAs) are expressed in normal or neoplastic pancreatic tissues. These lncRNAs are transcribed from genomic loci enriched with chromatin marks associated with promoter regions and showed to be originated from regions of the genome conserved in other species, as well as to be folded into stable and conserved RNA secondary structures. Moreover, we re-analyzed all public ESTs of the human parasite Schistosoma mansoni, identifying a variety of potential new ncRNAs and new genes not yet described for this organism. We also developed a web tool named NRDR - Noncoding RNA Databases Resource, an online repository for ncRNAs dabatases retrieval; and we present the IntromeDB, a public database related to data from the literature on expression and characterization of intronic ncRNAs of eukaryotic organisms obtained from a variety of tissues and biological conditions. Finally, we designed two new Agilent 244k intronic-exonic-intergenic microarray platforms for human transcripts. The results obtained clearly show that intronic transcripts have different biological signals, which indicate molecular functionalities, and suggest that computer analysis coupled to large-scale 12 experiments (eg. microarrays, MPSS, NGS) is an important strategy in the arsenal of tools used in the biological characterization of these transcripts.Biblioteca Digitais de Teses e Dissertações da USPSergio Verjovski de AlmeidaCoutinho, Vinicius Ramos Henriques Maracajá2013-08-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114634/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-07-27T13:45:05Zoai:teses.usp.br:tde-20230725-114634Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-07-27T13:45:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
not available
title Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
spellingShingle Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
Coutinho, Vinicius Ramos Henriques Maracajá
Expressão gênica
Genomas
RNA
title_short Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
title_full Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
title_fullStr Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
title_full_unstemmed Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
title_sort Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos
author Coutinho, Vinicius Ramos Henriques Maracajá
author_facet Coutinho, Vinicius Ramos Henriques Maracajá
author_role author
dc.contributor.none.fl_str_mv Sergio Verjovski de Almeida
dc.contributor.author.fl_str_mv Coutinho, Vinicius Ramos Henriques Maracajá
dc.subject.por.fl_str_mv Expressão gênica
Genomas
RNA
topic Expressão gênica
Genomas
RNA
description Diversos estudos têm revelado que a maior parte das mensagens transcritas nos organismos superiores é composta por RNAs não codificadores de proteínas (ncRNAs). Os estudos finais do projeto ENCODE mostram que cerca de 75% das bases do genoma humano são transcritas. Nosso grupo vem estudando os RNAs longos (> 200 nt) não codificadores (RNAs TINs, RNAs totalmente intrônicos não codificadores e RNAs PIN, parcialmente intrônicos não codificadores) que potencialmente apresentam papéis regulatórios importantes nos genomas eucariotos. Embora vários estudos já tenham sido realizados a fim de elucidar suas funções, ainda há uma enorme escassez de informações ligadas à biologia destes transcritos, sendo necessária uma análise mais extensa e detalhada acerca de como eles são regulados e quais os seus papéis no universo celular. Neste trabalho realizamos uma extensa busca in silico em bancos de dados de ESTs públicas a fim de atualizarmos toda a evidência de atividade transcricional intrônica em 21 diferentes organismos eucariotos. Além disso, realizamos um estudo de expressão intrônica em fígado humano a partir de dados publicados na literatura, obtidos por duas técnicas de expressão gênica em larga-escala: microarranjos de cDNA com sondas intrônico-exônicas 44k e Massively Parallel Signature Sequencing (MPSS). Estes estudos de expressão permitiram identificar milhares de transcritos longos (> 200 nt) parcial ou totalmente intrônicos expressos no fígado humano. Posteriormente realizamos uma completa anotação destes RNAs baseada em homologia e estruturas secundárias evolutivamente conservadas e termodinamicamente estáveis, identificando quais deles seriam possíveis precursores de novas ou já conhecidas classes de ncRNAs. Também verificamos que RNAs não codificadores longos (lncRNAs) intrônicos e intergênicos humanos estão expressos em tecidos pancreáticos normais ou neoplásicos. Estes lncRNAs são transcritos em loci genômicos que estão enriquecidos com marcas de cromatina associadas a regiões promotoras, são conservados em outras espécies e apresentam estruturas secundárias conservadas e estáveis. Além disso, re-analizamos todo o repertório de ESTs públicas do parasita humano prostostomado Schistosoma mansoni, identificando uma variedade de potenciais novos ncRNAs e novos genes ainda não descritos para este organismo. Ainda desenvolvemos uma ferramenta web: NRDR – Noncoding RNA Databases Resource, um repositório online para recuperação de bancos de dados de ncRNAs disponíveis na rede. Também apresentamos o IntromeDB, uma base de dados pública referente a dados da literatura sobre expressão e caracterização deste tipo de ncRNAs intrônicos em organismos eucariotos, obtidos a partir dos mais variados tecidos e condições biológicas. Por fim, desenhamos duas novas plataformas customizadas Agilent de microarray 10 contendo 244 mil sondas para transcritos intrônicos, exônicos e intergênicos humanos. Os resultados obtidos deixam claro que os transcritos intrônicos apresentam diversos sinais biológicos que apontam para um tipo molecular funcional, e que as análises computacionais, em conjunto com estudos de expressão gênica em larga escala (p.ex. microarranjos, MPSS e sequenciadores de última geração), são importantes para o arsenal de ferramentas utilizadas na caracterização biológica destes transcritos.
publishDate 2013
dc.date.none.fl_str_mv 2013-08-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114634/
url https://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114634/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090937063735296