Splicing kinetics revealed by nascent transcript sequencing

Detalhes bibliográficos
Autor(a) principal: Rebelo, Kenny Patrick Figueira
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/28305
Resumo: Tese de mestrado, Bioinformática e Biologia Computacional (Biologia Computacional) Universidade de Lisboa, Faculdade de Ciências, 2017
id RCAP_bb3345b7e5eaa09d8b6cff9c1d73a0f7
oai_identifier_str oai:repositorio.ul.pt:10451/28305
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Splicing kinetics revealed by nascent transcript sequencingmNET-seqTranscriçãoSplicingSpliceossomaCTDTeses de mestrado - 2017Departamento de Biologia VegetalTese de mestrado, Bioinformática e Biologia Computacional (Biologia Computacional) Universidade de Lisboa, Faculdade de Ciências, 2017A transcrição é o primeiro passo da expressão génica, no qual um segmento particular de informação presente no DNA é copiado para RNA mensageiro (mRNA), que por sua vez irá ser traduzido tendo como resultado final o conjunto de proteínas que suportam a vida. A biogénese do RNA mensageiro (mRNA) é um processo constituído por múltiplas etapas. Imediatamente a seguir à transcrição o RNA é modificado na extremidade 5' pela adição de uma 7-methylguanosina. Segue-se o splicing, que resulta na remoção dos intrões. Finalmente o RNA é clivado na extremidade 3' e modificado pela adição de uma cauda poli(A). Uma vez que a maior parte destes processos ocorre enquanto a molécula de RNA nascente ainda está acoplada à RNA polimerase II (Pol II), considera-se que a biogénese do mRNA é maioritariamente um processo co-transcricional. A associação entre Pol II e processamento de moléculas precursoras de mRNA (pré-mRNAs) é mediada pela maior subunidade da Pol II que se caracteriza por possuir, nos organismos eucariotas, um domínio carboxilo terminal (CTD) altamente longo e flexível. Este serve como plataforma para ancoragem de várias proteínas que regulam a transcrição e o processamento do pré-mRNA. O CTD da Pol II nas células humanas inclui 52 repetições da sequência proteica consenso YSPTSPS que é conservada entre leveduras e mamíferos. Para além de 21 repetições com a sequência consenso, as células humanas apresentam ainda 31 repetições de sequências mais degeneradas maioritariamente na última metade (desde a repetição 26 até à 52). Durante o ciclo da transcrição, composto por iniciação, elongação e terminação, o CTD é reversivelmente modificado por várias reações químicas, nomeadamente por fosforilações. Consoante o tipo de modificação, o CTD manifesta afinidade para diferentes proteínas. Assim, consoante a fase da transcrição, o CTD recruta proteínas responsáveis por etapas específicas do processamento do pré-mRNA. Antes da Pol II iniciar a transcrição o CTD encontra-se sobretudo desfosforilado. Durante a fase de iniciação da transcrição o CTD está maioritariamente fosforilado na serina 5 (S5P), enquanto que na fase de elongação o CTD vai gradualmente ficando mais fosforilado na serina 2 (S2P) perdendo ao mesmo ritmo o nível de fosforilação em S5P até à fase de terminação onde o CTD estará maioritariamente fosforilado na S2P. A transcrição termina quando a Pol II se dissocia da cadeia de DNA, ficando o CTD desfosforilado e pronto para começar um novo ciclo. O splicing de pré-mRNAs consiste num processo químico constituído por duas fases em que é primeiro gerado um grupo hidroxilo 3' livre (3'-OH) no exão a montante e se cria uma ligação fosfodiéster 2'-5' na adenosina no ponto de ramificação ("branch point") responsável pela estrutura característica em forma de laço adotada pelo intrão. Na segunda fase, o grupo 3'-OH do exão a montante realiza um ataque nucleofílico no local de splicing (SS) a 3' de forma a ligar os exões e excisar a estrutura de laço formada pelo intrão. Estas reações ocorrem dentro do spliceossoma cataliticamente ativo, mas antes de chegar a este ponto é necessário que o SS a 3' esteja exposto, isto é, deixe de estar protegido pela estrutura da Pol II. De facto, as sequências de nucleótidos presentes nos locais local de splicing a 5' e a 3' precisam de estar acessíveis para serem reconhecidas por componentes do spliceossoma. A maior parte do splicing ocorre co-transcricionalmente, isto é, enquanto a molécula de pré-mRNA ainda está acoplada à Pol II durante a transcrição da cadeia de DNA. Ao longo dos últimos anos foram realizados inúmeros estudos que revelam uma íntima relação entre o splicing e da transcrição, com importantes repercussões funcionais. Por exemplo, já foi descrito que a velocidade de elongação da Pol II influencia a capacidade de reconhecimento de locais de splicing, pelo que a existência de pausas da Pol II determina a escolha de padrões distintos de splicing alternativo. Esta associação entre a transcrição e a biogénese do mRNA é determinante para a regulação da expressão génica. No entanto, sabe-se pouco sobre os mecanismos que ligam as duas maquinarias moleculares. O objetivo deste trabalho foi realizar um estudo à escala genómica do acoplamento entre a transcrição e o splicing utilizando uma estratégia de sequenciação de nova geração denominada "Native Elongation Transcript sequencing in mammalian cells" (mNET-seq). Esta foi a abordagem escolhida porque era aquela que nos permite estudar perfis de transcrição nascente com resolução de nucleótido a nucleótido ao nível de todo o genoma, onde podemos então procurar padrões específicos de pausa da Pol II. O meu trabalho conducente a esta dissertação de mestrado consistiu na análise bioinformática de dados gerados, através da plataforma Illumina Hiseq 2500, no laboratório do Professor Proudfoot na Universidade de Oxford, Reino Unido, tendo sido o planeamento experimental conduzido em colaboração com a Professora Carmo-Fonseca no Instituto de Medicina Molecular da Faculdade de Medicina da Universidade de Lisboa. Os resultados obtidos revelaram a presença de componentes do spliceossoma, nomeadamente os pequenos RNAs nucleares (snRNA) U1, U2, U4 e U5, num complexo associado especificamente à Pol II com o seu domínio carboxilo terminal contendo resíduos de serina 5 fosforilados (S5P Pol II). Encontramos também a nível global produtos intermediários da reação de splicing em associação com S5P Pol II. A capacidade da técnica de mNET-seq de mapear intermediários de splicing permitiu-nos uma análise global do splicing co-transcricional in vivo. O cálculo da percentagem de índice de splicing (PSI) mostrou que praticamente todos os exões que apresentam um intermediário de splicing associado a Pol II estão completamente incluídos no mRNA. Observamos níveis mais elevados de densidade da Pol II nos exões com splicing co-transcricional, em particular para o conjunto de dados de S5P CTD. Ademais identificamos moléculas de RNA já desprovidas de intrões associadas preferencialmente a S5P Pol II. Nestes casos observamos uma acumulação de transcritos já processados sugestivos de pausas da Pol II relacionadas com o processo de splicing. A nossa análise permitiu-nos ainda identificar a posição da Pol II no momento em que ocorreu splicing. Os resultados mostram uma tendência para o splicing ocorrer quando a Pol II transcreveu apenas cerca de 20 nucleótidos após o local de splicing a 3'. No entanto, ainda que raramente, foram detetados eventos de splicing a ocorrer quando a Pol II já se encontrava a transcrever o intrão a jusante. Em resumo, os resultados obtidos revelam que as reações de splicing podem ocorrer imediatamente após a transcrição pela Pol II e sugerem que o splicing impõe uma travagem à velocidade da Pol II. Os resultados deste trabalho permitiram ainda identificar algumas limitações impostas pela técnica de mNET-seq, pelo que será necessário desenvolver aperfeiçoamentos e/ou técnicas adicionais para uma melhor caracterização global dos mecanismos de splicing co-transcricional no futuro. A principal limitação relaciona-se com o reduzido tamanho dos fragmentos de RNA que resistem à digestão pela Micrococcal nuclease (Mnase). Neste trabalho analisamos fragmentos de RNA com um tamanho entre 60 a 160 nucleótidos, o que não nos permite localizar a posição da Pol II no momento em que o splicing lento acontece nas células humanas. É previsível que o contínuo desenvolvimento de novas plataformas de sequenciação em larga escala vão também permitir uma análise mais precisa dos eventos de processamento do RNA que decorrem durante a transcrição. Desenvolvimentos futuros que permitam aumentar os níveis de resolução e sensibilidade das análises são absolutamente essenciais para uma correta interpretação da biologia subjacente. A par do desenvolvimento tecnológico, importa também investigar se as observações aqui reportadas em células humanas (células HeLa) são conservadas do ponto de vista evolutivo, nomeadamente noutros mamíferos e em organismos menos complexos. Em particular, seria importante determinar em que estadio ao longo da evolução ocorreu a separação entre splicing rápido e lento, e qual das duas formas (rápida e lenta) terá surgido primeiro.The making of messenger RNA is a multi-step process that starts with transcription of a protein-coding DNA template by RNA polymerase II (Pol II) followed by capping the 5' end of the nascent transcript with a 7-methylguanosine, excision of introns, and formation of a 3' end by cleavage and addition of a poly(A) tail. Splicing of precursor mRNAs (pre-mRNAs) is a two-step chemical process that first generates a free 3' hydroxyl group on the 5' exon and creates a 2'-5' phosphodiester linkage at the adenosine branch site that causes the intron to adopt a characteristic lariat structure. In the second step, the 3'-OH of the 5' exon attacks the 3' splice site (SS) to form ligated exons and excised intron lariat. Most of these processes take place co-transcriptionally, i.e., while the nascent RNA molecule is still attached to Pol II on the DNA template. Co-transcriptionality of mRNA biogenesis has important regulatory implications for gene expression. Although several lines of evidence suggest that splicing of pre-mRNA is intimately coupled to Pol II transcription, mechanistic links between the transcription and splicing machineries are little-understood. The aim of this work was to study at genome-wide level the coupling between transcription and splicing using a recently developed next generation sequencing strategy termed Native Elongation Transcript sequencing in mammalian cells (mNET-seq) through bioinformatics analysis of datasets generated in the laboratory of Professor Proudfoot at the University of Oxford in collaboration with Professor Carmo-Fonseca at iMM Lisboa. We found components of the spliceosome, namely U1, U2, U4 and U5 snRNAs, specifically associated with serine 5-phosphorylated (S5P) CTD Pol II. Intermediates of many splicing events as well as a subset of spliced transcripts were also detected in S5P Pol II complexes. Finally, specific patterns of splicing-related polymerase pausing were identified. Our results reveal that splicing can be completed immediately after exposure of the 3'-splice site and suggest that splicing induces a barrier to transcription elongation.Fonseca, M. Carmo, 1959-Sousa, Lisete Maria Ribeiro de, 1972-Repositório da Universidade de LisboaRebelo, Kenny Patrick Figueira2020-06-10T00:30:14Z201720172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/28305TID:201853680enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:19:56Zoai:repositorio.ul.pt:10451/28305Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:44:33.036727Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Splicing kinetics revealed by nascent transcript sequencing
title Splicing kinetics revealed by nascent transcript sequencing
spellingShingle Splicing kinetics revealed by nascent transcript sequencing
Rebelo, Kenny Patrick Figueira
mNET-seq
Transcrição
Splicing
Spliceossoma
CTD
Teses de mestrado - 2017
Departamento de Biologia Vegetal
title_short Splicing kinetics revealed by nascent transcript sequencing
title_full Splicing kinetics revealed by nascent transcript sequencing
title_fullStr Splicing kinetics revealed by nascent transcript sequencing
title_full_unstemmed Splicing kinetics revealed by nascent transcript sequencing
title_sort Splicing kinetics revealed by nascent transcript sequencing
author Rebelo, Kenny Patrick Figueira
author_facet Rebelo, Kenny Patrick Figueira
author_role author
dc.contributor.none.fl_str_mv Fonseca, M. Carmo, 1959-
Sousa, Lisete Maria Ribeiro de, 1972-
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Rebelo, Kenny Patrick Figueira
dc.subject.por.fl_str_mv mNET-seq
Transcrição
Splicing
Spliceossoma
CTD
Teses de mestrado - 2017
Departamento de Biologia Vegetal
topic mNET-seq
Transcrição
Splicing
Spliceossoma
CTD
Teses de mestrado - 2017
Departamento de Biologia Vegetal
description Tese de mestrado, Bioinformática e Biologia Computacional (Biologia Computacional) Universidade de Lisboa, Faculdade de Ciências, 2017
publishDate 2017
dc.date.none.fl_str_mv 2017
2017
2017-01-01T00:00:00Z
2020-06-10T00:30:14Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/28305
TID:201853680
url http://hdl.handle.net/10451/28305
identifier_str_mv TID:201853680
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134366522146816