Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas

Detalhes bibliográficos
Autor(a) principal: Pellegrina, Diogo Vieira da Silva
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-25062020-165840/
Resumo: O adenocarcinoma ductal do pâncreas (PDAC) é uma neoplasia caracterizada por uma alta heterogeneidade genômica e a relação entre mutações somáticas recorrentes e os padrões de expressão gênica nestes tumores é ainda pouco caracterizada. Foi desenvolvida uma rotina computacional para processar e analisar dados do sequenciamento do exoma de 14 casos de pacientes com PDAC e identificar mutações somáticas simples (SNVs, indels). Dados de transcriptoma das mesmas amostras foram usados para montagem de uma rede de co-expressão de genes codificadores de proteína e RNAs nãocodificadores longos (lncRNAs). Análises de enriquecimento de genes foram usadas para identificar vias moleculares entre genes recorrentemente mutados, genes diferencialmente expressos ou genes localizados em módulos específicos da rede. A alta conectividade de transcritos com genes de vias moleculares específicas foi usada para inferência funcional de lncRNAs. Foram identificadas 28.683 mutações simples em 12.438 genes, incluindo 3.314 alterações somáticas já anotadas em tumores humanos e 976 genes com papel oncogênico ou supressor tumoral no PDAC. Entre 1.603 candidatos a genes drivers destacam-se 18 com mutações recorrentes, incluindo componentes do complexo Ubiquitina Ligase E3, fatores de transcrição, modificador de histonas, remodeladores de cromatina, transdução de sinal e apoptose. A sobreposição de vias moleculares enriquecidas em mutações somáticas e alterações transcricionais identificou 83 vias em comum, incluindo Ras protein signal transduction, apoptotic process, e cell adhesion. Para 11 genes com mutações somáticas com alta prevalência foi encontrada uma correlação entre a presença da mutação e alterações na expressão de módulos da rede. Entre esses se destaca a associação de mutações em KRAS com a expressão de módulos enriquecidos nas vias Hedgehog signalling, WNT signalling, DNA repair e Cell Cycle, e mutações em TP53 e a expressão alterada em módulos contendo genes das vias de sinalização de ErbB. Foram também observadas associações significativas (p <1x10-4) entre a expressão gênica de módulos da rede e assinaturas mutacionais e a sobrevida dos pacientes. Foram identificados lncRNAs diferencialmente expressos no PDAC e com alta conectividade a genes associados a vias moleculares específicas como Cell Adhesion, O-linked glycosylation of mucins e DNA Repair. Validações experimentais corroboraram a função regulatória destes lncRNAs nestas vias. A existência de casos sem mutação em KRAS e de vias em que todos os casos avaliados possuem ao menos um gene da via mutado sugerem que mutações em outros componentes destas vias possam fenocopiar o efeito oncogênico de mutações em KRAS. Este trabalho confirmou a alta heterogeneidade de mutações somáticas no PDAC e revelou novos genes drivers candidatos representados na população brasileira.
id USP_05ab16556bf29a196ec4e9d39a9d0243
oai_identifier_str oai:teses.usp.br:tde-25062020-165840
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Análise integrada de alterações somáticas e transcricionais em tumores de pâncreasIntegrated analysis of somatic and transcriptional alterations in pancreatic cancerCancerCâncerCoexpression networksExomaExomePancreasPâncreasRedes de co-expressãoTranscriptomaTranscriptomeO adenocarcinoma ductal do pâncreas (PDAC) é uma neoplasia caracterizada por uma alta heterogeneidade genômica e a relação entre mutações somáticas recorrentes e os padrões de expressão gênica nestes tumores é ainda pouco caracterizada. Foi desenvolvida uma rotina computacional para processar e analisar dados do sequenciamento do exoma de 14 casos de pacientes com PDAC e identificar mutações somáticas simples (SNVs, indels). Dados de transcriptoma das mesmas amostras foram usados para montagem de uma rede de co-expressão de genes codificadores de proteína e RNAs nãocodificadores longos (lncRNAs). Análises de enriquecimento de genes foram usadas para identificar vias moleculares entre genes recorrentemente mutados, genes diferencialmente expressos ou genes localizados em módulos específicos da rede. A alta conectividade de transcritos com genes de vias moleculares específicas foi usada para inferência funcional de lncRNAs. Foram identificadas 28.683 mutações simples em 12.438 genes, incluindo 3.314 alterações somáticas já anotadas em tumores humanos e 976 genes com papel oncogênico ou supressor tumoral no PDAC. Entre 1.603 candidatos a genes drivers destacam-se 18 com mutações recorrentes, incluindo componentes do complexo Ubiquitina Ligase E3, fatores de transcrição, modificador de histonas, remodeladores de cromatina, transdução de sinal e apoptose. A sobreposição de vias moleculares enriquecidas em mutações somáticas e alterações transcricionais identificou 83 vias em comum, incluindo Ras protein signal transduction, apoptotic process, e cell adhesion. Para 11 genes com mutações somáticas com alta prevalência foi encontrada uma correlação entre a presença da mutação e alterações na expressão de módulos da rede. Entre esses se destaca a associação de mutações em KRAS com a expressão de módulos enriquecidos nas vias Hedgehog signalling, WNT signalling, DNA repair e Cell Cycle, e mutações em TP53 e a expressão alterada em módulos contendo genes das vias de sinalização de ErbB. Foram também observadas associações significativas (p <1x10-4) entre a expressão gênica de módulos da rede e assinaturas mutacionais e a sobrevida dos pacientes. Foram identificados lncRNAs diferencialmente expressos no PDAC e com alta conectividade a genes associados a vias moleculares específicas como Cell Adhesion, O-linked glycosylation of mucins e DNA Repair. Validações experimentais corroboraram a função regulatória destes lncRNAs nestas vias. A existência de casos sem mutação em KRAS e de vias em que todos os casos avaliados possuem ao menos um gene da via mutado sugerem que mutações em outros componentes destas vias possam fenocopiar o efeito oncogênico de mutações em KRAS. Este trabalho confirmou a alta heterogeneidade de mutações somáticas no PDAC e revelou novos genes drivers candidatos representados na população brasileira.The pancreatic ductal adenocarcinoma (PDAC) is a neoplasia with a characteristically high genomic heterogeneity and without much data on the interactions between somatic mutations and the tumoral gene expression. A computational routine was developed to process and analyze exome sequencing data from 14 samples from PDAC patients and identify its simple somatic mutations (SNVs and indels). Transcriptome data from those same samples was used to build a coexpression network of protein coding and long noncoding genes (lncRNAs). Pathway enrichment analyses were used to identify molecular pathways with frequently mutated genes, differentially expressed genes, or genes found on specific network modules. lncRNAs were found in the coexpression network showing strong connectivity in certain pathways, for which it was possible to infer a regulatory function. 28.683 simple mutations in 12.438 genes, including 3.314 somatic alterations already cataloged in human tumors and 976 genes characterized as tumor suppressors or oncogenes in PDAC. From the 1.603 driver gene candidates 18 are found recurrenty, including components of the Ubiquitin Ligase E3 complex, transcription factors, histone modifiers, chromatin remodelers, genes involved in signal transduction and apoptosis. The 83 molecular pathways that are both enriched by somatic mutations and differential expression , including Ras protein signal transduction, apoptotic process, and cell adhesion. For 11 of the most prevalent genes a correlation was found between being mutated and the gene expression on network modules. Among those is highlighted the KRAS mutations correlation with altered expression on modules enriched by Hedgehog signalling, WNT signalling, DNA repair and Cell Cycle pathways, and TP53 mutations with altered expression on modules enriched by the ErbB signaling pathway. Significative associations (p <1x10-4) were also found between module gene expression and both mutational signatures and survival. Differentially expressed lncRNAs were identified highly connected to specific molecular pathways such as Cell Adhesion, O-linked glycosylation of mucins and DNA Repair. Experimental validations supported the proposed regulatory functions of the lncRNAs in those pathways. The existence of PDAC cases without KRAS mutations and of pathways in which every study case has a mutation in at least one gene suggests that some mutations in genes from those pathways might phenocopy the oncogene effect of mutations in KRAS. This work confirmed the high heterogeneity of somatic mutations in PDAC and revealed new driver gene candidates in a sample of the brazilian population.Biblioteca Digitais de Teses e Dissertações da USPReis, Eduardo Moraes RegoPellegrina, Diogo Vieira da Silva2020-05-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/95/95131/tde-25062020-165840/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-06-26T00:04:02Zoai:teses.usp.br:tde-25062020-165840Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-06-26T00:04:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
Integrated analysis of somatic and transcriptional alterations in pancreatic cancer
title Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
spellingShingle Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
Pellegrina, Diogo Vieira da Silva
Cancer
Câncer
Coexpression networks
Exoma
Exome
Pancreas
Pâncreas
Redes de co-expressão
Transcriptoma
Transcriptome
title_short Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
title_full Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
title_fullStr Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
title_full_unstemmed Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
title_sort Análise integrada de alterações somáticas e transcricionais em tumores de pâncreas
author Pellegrina, Diogo Vieira da Silva
author_facet Pellegrina, Diogo Vieira da Silva
author_role author
dc.contributor.none.fl_str_mv Reis, Eduardo Moraes Rego
dc.contributor.author.fl_str_mv Pellegrina, Diogo Vieira da Silva
dc.subject.por.fl_str_mv Cancer
Câncer
Coexpression networks
Exoma
Exome
Pancreas
Pâncreas
Redes de co-expressão
Transcriptoma
Transcriptome
topic Cancer
Câncer
Coexpression networks
Exoma
Exome
Pancreas
Pâncreas
Redes de co-expressão
Transcriptoma
Transcriptome
description O adenocarcinoma ductal do pâncreas (PDAC) é uma neoplasia caracterizada por uma alta heterogeneidade genômica e a relação entre mutações somáticas recorrentes e os padrões de expressão gênica nestes tumores é ainda pouco caracterizada. Foi desenvolvida uma rotina computacional para processar e analisar dados do sequenciamento do exoma de 14 casos de pacientes com PDAC e identificar mutações somáticas simples (SNVs, indels). Dados de transcriptoma das mesmas amostras foram usados para montagem de uma rede de co-expressão de genes codificadores de proteína e RNAs nãocodificadores longos (lncRNAs). Análises de enriquecimento de genes foram usadas para identificar vias moleculares entre genes recorrentemente mutados, genes diferencialmente expressos ou genes localizados em módulos específicos da rede. A alta conectividade de transcritos com genes de vias moleculares específicas foi usada para inferência funcional de lncRNAs. Foram identificadas 28.683 mutações simples em 12.438 genes, incluindo 3.314 alterações somáticas já anotadas em tumores humanos e 976 genes com papel oncogênico ou supressor tumoral no PDAC. Entre 1.603 candidatos a genes drivers destacam-se 18 com mutações recorrentes, incluindo componentes do complexo Ubiquitina Ligase E3, fatores de transcrição, modificador de histonas, remodeladores de cromatina, transdução de sinal e apoptose. A sobreposição de vias moleculares enriquecidas em mutações somáticas e alterações transcricionais identificou 83 vias em comum, incluindo Ras protein signal transduction, apoptotic process, e cell adhesion. Para 11 genes com mutações somáticas com alta prevalência foi encontrada uma correlação entre a presença da mutação e alterações na expressão de módulos da rede. Entre esses se destaca a associação de mutações em KRAS com a expressão de módulos enriquecidos nas vias Hedgehog signalling, WNT signalling, DNA repair e Cell Cycle, e mutações em TP53 e a expressão alterada em módulos contendo genes das vias de sinalização de ErbB. Foram também observadas associações significativas (p <1x10-4) entre a expressão gênica de módulos da rede e assinaturas mutacionais e a sobrevida dos pacientes. Foram identificados lncRNAs diferencialmente expressos no PDAC e com alta conectividade a genes associados a vias moleculares específicas como Cell Adhesion, O-linked glycosylation of mucins e DNA Repair. Validações experimentais corroboraram a função regulatória destes lncRNAs nestas vias. A existência de casos sem mutação em KRAS e de vias em que todos os casos avaliados possuem ao menos um gene da via mutado sugerem que mutações em outros componentes destas vias possam fenocopiar o efeito oncogênico de mutações em KRAS. Este trabalho confirmou a alta heterogeneidade de mutações somáticas no PDAC e revelou novos genes drivers candidatos representados na população brasileira.
publishDate 2020
dc.date.none.fl_str_mv 2020-05-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/95/95131/tde-25062020-165840/
url https://www.teses.usp.br/teses/disponiveis/95/95131/tde-25062020-165840/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809091067578941440