Analysis of the contribution of alternative splicing to glioma subtype definition

Detalhes bibliográficos
Autor(a) principal: Maia, Maria Teresa Proença Mendes
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10451/25384
Resumo: Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2016
id RCAP_7227838f3653466b2708c9e03e33c892
oai_identifier_str oai:repositorio.ul.pt:10451/25384
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Analysis of the contribution of alternative splicing to glioma subtype definitionSplicing alternativoGliomaCancroTranscriptómicaTeses de mestrado - 2016Domínio/Área Científica::Ciências Naturais::Ciências BiológicasTese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2016Gliomas são tumores cerebrais que têm origem em dois tipos de células: os astrócitos e os ologodendrócitos, os quais formam uma estrutura de suporte para os neurónios. Os gliomas são responsáveis por cerca de 80 % dos casos malignos de tumor cerebral. A classificação de gliomas fundou-se durante muito tempo em parâmetros histológicos, tais como o tipo histológico ou o estádio do tumor, uma medida do seu grau de malignidade, baseada na aparência e comportamento das células. A realização de estudos de larga escala fazendo uso das novas tecnologias ómicas, tem permitido melhorar os sistemas de classificação clássicos, através da identificação de assinaturas moleculares subjacentes aos diferentes subtipos tumorais. No caso de gliomas, uma publicação recente fez a descrição de um sistema de classificação robusto, baseado num painel de 1300 marcadores de metilação de DNA, aplicável a tumores dos estádios de 2 a 4, em que são definidos seis subtipos (LGm1 a LGm6) que formam grupos prognóstico bastante homogéneos (Ceccarelli et al., 2016). O splicing é um mecanismo de processamento pós-transcricional através do qual certos segmentos de uma molécula de pre-RNA mensageiro (pre-mRNA): os intrões, são eliminados, resultando num mRNA maduro constituído por segmentos chamados exões que codifica para uma proteína (ou produto génico). É um processo químico levado a cabo por um complexo macromolecular modular, que se designa por spliceossoma. O splicing alternativo consiste na produção de mais do que um tipo de mRNA maduro a partir do mesmo gene através da retenção ou eliminação seletiva de um exão/intrão, dito alternativo ou regulado. Este processo contribui para a geração de diversidade funcional de produtos génicos e é regulado de forma específica em cada tecido e estádio de desenvolvimento, sendo que alterações aos seus padrões normais estão descritos como podendo promover ou apoiar o processo de tumorigénese. A quantificação de splicing alternativo pode ser feita usando uma medida que se designa por index da percentagem de splicing ou PSI, e que corresponde à proporção de transcritos que incluem um exão regulado em relação ao total de transcritos de um gene. O presente projeto de tese visa analisar a contribuição da regulação de splicing alternativo para a definição da classificação dos gliomas de estádios 2 a 4, tendo como objeto de estudo o conjunto de dados de uma coorte de 674 casos de glioma depositado no portal TCGA (The Cancer Genome Atlas). Por forma a avaliar a existência de uma assinatura molecular própria ou associada aos subtipos de glioma estabelecidos, utilizou-se análise multivariada dos dados de quantificação de splicing alternativo, mas também de expressão génica. Utilizando análise de componentes principais (PCA), o splicing alternativo mostrou capturar diversidade biológica de forma muito semelhante à expressão génica. A componente principal associada aos dois níveis de dados transcriptómicos de maior relevância representou um gradiente de malignidade tumoral. O splicing alternativo demonstrou ser informativo relativamente à distinção dos subtipos LGm2, LGm3 e LGm4/5, enquanto os subtipos LGm1 e LGm6 revelaram uma grande heterogeneidade. Análise de expressão génica e splicing alternativo diferencial ao longo dos subtipos LGm permitiu identificar um grupo de 5970 genes e 1762 eventos de splicing associados à definição desses subtipos. De forma importante, 183 genes e 105 eventos de splicing com regulação diferencial afetam genes cujas mutações têm implicação causal em cancro demonstrada. Por fim, 41 fatores de splicing apresentaram de igual modo expressão génica diferencial entre subtipos, com os genes IGF2BP2 e IGF2BP3 apresentando os resultados mais significativos, nomeadamente uma expressão elevada em LGm1,4,5 e 6, os subtipos associado a um pior prognóstico. Análise de enriquecimento funcional realizada com a informação de regulação diferencial da expressão génica e splicing alternativo entre subtipos LGm revelou funções bilógicas distintas por cada processo. Enquanto os genes com alterações de expressão entre grupos de metilação de DNA se relacionaram com funções como resposta imune, proliferação, sobrevivência e adesão celulares, genes tendo o seu splicing alternativo alterado involveram sobretudo o processamento de RNA, síntese proteica e também apoptose. O valor do splicing alternativo e da expressão génica para o prognóstico em gliomas foi avaliado usado modelos de regressão de Cox para a sobrevida do paciente em função de diferentes fatores de risco. Um teste inicial sobre a capacidade da componente principal associada à malignidade para explicar a evolução do tempo de sobrevida do doente confirmou a superioridade desta dimensão dos dados de transcriptómica relativamente à variável estádio do tumor no que diz respeito a essa previsão. Subsequente análise de eventos de splicing e genes individuais como preditores de prognóstico resultou na descoberta de tantos quantos 11794 genes e 6657 eventos de splicing. Porém, apenas um gene e dois eventos de splicing alternativo foram capazes de melhorar a estimativa da evolução do doente relativamente a um modelo já contendo subtipos LGm, estádio do tumor e idade do doente, três covariáveis relevantes descritas na literatura. Os dois eventos em questão apresentaram distribuições de PSIs com variãncia muito baixa, pelo que constituiriam marcadores de prognóstico de pouca qualidade, além de não parecerem ter um interesse intrínseco já que não representam a possibilidade de geração de uma transição de uma isoforma dominante para outra. Finalmente, marcadores especificamente associados aos grupos LGm foram identificados a partir da interseção do conjunto que apresentou valor prognóstico independente do estádio do tumor e da idade do doente com o conjunto com regulação diferencial entre os seis subtipos. Desta análise resultou um total de 337 eventos de splicing alternativo, 50 dos quais acrescentando informação prognóstica relativamente aos dados de expressão génica, e também 20 genes de fatores de splicing. De entre estes últimos, seis codificavam para proteínas que se ligam ao RNA (RBPs) com motivos de ligação conhecidos, pelo que o seu potencial papel regulatório foi investigado. Uma metodologia para a descoberta de mecanismos de regulação de splicing alternativo em trans foi implementada. Concretamente, um algoritmo para a geração de mapas de regulação de splicing específicos de cada RBP foi usado, tendo como objetivo determinar as regiões regulatórias para fomento ou silenciamento do splicing de exões alternativos. A identificação da posição relativa dos alvos de regulação de cada RBP baseou-se na deteção dos eventos de splicing cujas percentagens de inclusão do exão alternativo se correlacionavam com a abundância da RBP e que efetivamente continham motivos de ligação para essa RBP nas regiões vizinhas do exão regulado. Este método foi validado para o fator de splicing bem estudado PTBP1, utilizando tanto um conjunto de dados provindo de tecidos saudáveis como com o da cohorte de glioma estudada. No entanto, a aplicação do mesmo procedimento a quatro dos seis fatores de splicing potencialmente associados com as alterações de splicing entre subtipos de glioma resultou em mapas de splicing de RNA inconsistentes entre os dois conjuntos de dados. Medidas para a melhoria desta metodologia foram identificadas e poderão ser aplicadas futuramente por forma a poder concluir sobre a relevância destas proteínas em glioma. Este estudo permitiu identificar um número de eventos de splicing alternativo e genes expressos, nomeadamente, genes de fatores de splicing, que apresentam comportamento diferencial em termos de malignidade e subtipo epigenático de glioma e que poderão ter valor diagnóstico e terapêutico interessante. Adicionalmente, um novo método computacional para descoberta de mecanismos de regulação de splicing alternativo foi implementado, tendo permitido propor um mecanismo de ação para o fator de splicing relevante em glioma KHDRBS2.Gliomas are brain primary tumours that originate from two kinds of glial cells: astrocytes and oligodendrocytes, which make up a supportive structure for neurons. Classification of gliomas has for long relied on histological parameters, like cell type composition and grade, a measurement of the degree of malignancy of a tumour based on cell appearance and behaviour. Large scale studies employing the new omics technologies have allowed to improve classic classification systems, through the identification of molecular signatures behind each tumour subtype. In the case of gliomas, a recent publication described a robust classification system based on DNA-methylation profiling, applicable to tumours from grades 2 to 4 and defining six subtypes (LGm1 to LGm6) forming quite homogeneous prognostic groups (Ceccarelli et al., 2016). Alternative splicing is a post-transcriptional mechanism of regulation of gene expression that contributes to generate functional diversity of gene products through the selective elimination of certain segments of pre-messenger RNA (pre-mRNA) molecules. Alternative splicing is regulated in a tissue and developmental specific way and alterations to its normal patterns have been extensively reported to promote or help sustaining tumorigenesis. The work presented here aimed at determining the contribution of alternative splicing to glioma subtype definition, having as a focus a cohort of 674 cases of glioma grades 2 to 4, coming from the Cancer Genome Atlas (TCGA) data portal. Differential gene expression and differential splicing analyses across LGm subtypes allowed to identify a group of 5970 genes and 1762 events of alternative splicing whose regulation is associated with subtype definition. Importantly, among these differentially regulated markers, there were 41 splicing factor genes and 46 splicing factor gene-associated events of splicing. In order to enquire about the existence of particular molecular signatures in glioma, multivariate exploratory data analysis was performed on alternative splicing and also gene expression data. Alternative splicing showed to capture sample diversity in a way that was very similar to gene expression. The most revealing principal component associated with both transcriptomic data levels presented a gradient of tumour malignancy. As for the ability of alternative splicing to distinguish subtypes, it could partially separate LGm2, LGm3 and LGm4/5 groups, while LGm1 and LGm6 revealed a high heterogeneity. The value of alternative splicing and gene expression in glioma prognosis was evaluated using Cox regression models for patient’s overall survival outcome as a function of different predictors. An initial test on the ability of the malignancy associated principle component to explain patient outcome strikingly confirmed the superiority of this dimension of transcriptomic data to make this prediction in relation to tumour grade. In turn, analysis of individual alternative splicing events and expressed genes as prognosis predictors resulted in as many as 11794 genes and 6657 events of splicing. However, only one gene and two alternative splicing events were able to improve patient survival outcome estimation relative to a model that already accounted for LGm subtype, tumour grade and patient age, three relevant covariates described in the literature. Finally, in terms of prognostic markers specifically associated with LGm groups, a total of 337 splicing events were found, 50 of which adding information in relation to gene expression, and also 20 splicing factor genes. From these latter, six encoded RNA-binding proteins (RBPs) with known RNA-binding motifs and their potential regulatory role was investigated. A methodology for the discovery of mechanisms of alternative splicing regulation in trans was implemented. Specifically, an algorithm to generate maps of splicing regulation specific of each RBP was used, aimed at determining regulatory regions for their enhancing or silencing role in splicing of alternative exons. This method was validated for the known splicing factor PTBP1, both using an RNA-seq dataset from healthy tissues and the studied glioma one. However, application of the same procedure to four of the six splicing factors potentially associated with alternative splicing changes across glioma subtypes resulted in RNA splicing maps that were inconsistent between the two datasets. Improvements to the methodology used were identified and may be applied in the future so that stronger conclusions about the relevance of these proteins in glioma can be taken. This study allowed to outline a number of alternative splicing events and expressed genes, namely splicing factor genes, that behave differently according to glioma malignancy and epigenetic groups and that may be of interesting diagnostic and therapeutic value. Also, a novel computational method for discovery of mechanisms of regulation of alternative splicing was implemented and allowed to proposal a mechanism of action for the glioma-relevant splicing factor KHDRBS2.Morais, Nuno Luís Barbosa,1977-Sousa, Lisete Maria Ribeiro de,1972-Repositório da Universidade de LisboaMaia, Maria Teresa Proença Mendes2016-12-22T14:07:50Z201620162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/25384TID:201330911enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-08T16:15:04Zoai:repositorio.ul.pt:10451/25384Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:42:24.216766Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Analysis of the contribution of alternative splicing to glioma subtype definition
title Analysis of the contribution of alternative splicing to glioma subtype definition
spellingShingle Analysis of the contribution of alternative splicing to glioma subtype definition
Maia, Maria Teresa Proença Mendes
Splicing alternativo
Glioma
Cancro
Transcriptómica
Teses de mestrado - 2016
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
title_short Analysis of the contribution of alternative splicing to glioma subtype definition
title_full Analysis of the contribution of alternative splicing to glioma subtype definition
title_fullStr Analysis of the contribution of alternative splicing to glioma subtype definition
title_full_unstemmed Analysis of the contribution of alternative splicing to glioma subtype definition
title_sort Analysis of the contribution of alternative splicing to glioma subtype definition
author Maia, Maria Teresa Proença Mendes
author_facet Maia, Maria Teresa Proença Mendes
author_role author
dc.contributor.none.fl_str_mv Morais, Nuno Luís Barbosa,1977-
Sousa, Lisete Maria Ribeiro de,1972-
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Maia, Maria Teresa Proença Mendes
dc.subject.por.fl_str_mv Splicing alternativo
Glioma
Cancro
Transcriptómica
Teses de mestrado - 2016
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
topic Splicing alternativo
Glioma
Cancro
Transcriptómica
Teses de mestrado - 2016
Domínio/Área Científica::Ciências Naturais::Ciências Biológicas
description Tese de mestrado em Bioinformática e Biologia Computacional, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2016
publishDate 2016
dc.date.none.fl_str_mv 2016-12-22T14:07:50Z
2016
2016
2016-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/25384
TID:201330911
url http://hdl.handle.net/10451/25384
identifier_str_mv TID:201330911
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134338909995008