Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis

Detalhes bibliográficos
Autor(a) principal: Marchi, Fabio Albuquerque
Data de Publicação: 2014
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-24062014-110926/
Resumo: O desenvolvimento de metodologias sobre integração de dados na área de biologia de sistemas é de grande importância devido ao aumento contínuo de dados resultantes de análises globais que são depositados em bancos de dados públicos. Poucas metodologias e ferramentas de bioinformática levam em consideração a diferenciação entre drivers e passengers, fundamental para a identificação de genes importantes para o desenvolvimento e progressão tumoral. Os perfis de expressão gênica têm possibilitado a identificação de assinaturas genéticas em uma grande variedade de tumores humanos. Além disso, as alterações epigenéticas, como a expressão de microRNAs (miRNA) e a metilação do DNA, também contribuem para o desenvolvimento de diversos tipos de doenças. Entretanto, a grande maioria destes estudos não mostra integração dos resultados obtidos pelas diferentes estratégias utilizadas, o que teria maior impacto na identificação de drivers moleculares. Neste estudo foi realizada a integração de quatro níveis de alterações em 31 amostras de câncer de pênis (CaPe): alteração do número de cópias do DNA, metilação de ilhas CpGs, expressão de miRNAs e expressão de transcritos codificadores. O conhecimento das alterações genéticas e epigenéticas relacionadas ao desenvolvimento de câncer de pênis é bastante limitado, devido principalmente a sua rara incidência. Uma parcela significativa dos casos de CaPe tem sido associada com a infecção pelo Papilomavírus Humano (HPV). A metodologia para integração de dados foi aplicada utilizando duas abordagens: (1) estudo das alterações em câncer de pênis (tumor e normal) independente da infecção pelo HPV e (2) estudo das alterações relacionadas à infecção pelo HPV. A análise foi dividida em duas etapas, com a seleção de genes alvos específicos da doença e inferência de módulos a partir desses alvos. Destacam-se na metodologia a seleção de genes candidatos a driver utilizando a atribuição de pesos para cada alteração seguindo critérios pré-determinados, e.g. se o gene estava presente em uma região rara, após classificação pelo DGV (Database of Genomic Variants) e a utilização desses genes como alvos para identificação das possíveis relações entre eles e os módulos. Também foi realizada a adaptação da metodologia de redes em módulos, com a inclusão de genes passengers e interação proteína-proteína (PPI) como um critério para seleção dos módulos. Essa análise se mostrou eficaz na identificação de módulos gênicos bem relacionados com os drivers, resultando na escolha de vias biológicas potencialmente responsáveis pelo desenvolvimento do tumor. Os genes identificados após a comparação entre amostras tumorais e normais (SOX17, TWIST1, CAV1, PPARG, FLI1 e TNFSF10) e no estudo entre amostras positivas e negativas para infecção pelo HPV (PCNA, SOX14 e RFC4) foram validados in situ por técnicas independentes. Para validação in silico das alterações encontradas na metodologia de integração de dados e para validação da metodologia de redes em módulos foram utilizadas 255 amostras de glioblastoma multiforme obtidas no banco de dados TCGA (The Cancer Genome Atlas). Foram identificadas vias biológicas importantes relacionadas ao processo tumoral, como regulação do crescimento celular (GO:0001558, p=0,0062), homeostase (GO:0048872, $p=0,0082) e regulação da transcrição (GO:0003700, p=0,00089). Também foi realizada uma meta-análise utilizando amostras do TCGA, que encontrou um perfil similar de expressão para os genes CAV1, DLC1,FLI1, MSX1, NRN1, PML, PPARG e SOX17 (T vs N) e PCNA e RFC4 (HPV+ vs HPV-). Para o nosso conhecimento, esse é o primeiro estudo em CaPe utilizando análise integrada de quatro níveis de alteração. Além disso, foram encontradas alterações não randômicas capazes de modificar transcritos específicos e contribuir para o conhecimento da patobiologia dos tumores de pênis.
id USP_fc2a5b564e201e591a916fb8c1f97ee8
oai_identifier_str oai:teses.usp.br:tde-24062014-110926
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênisIntegrative methodology in penile carcinomascancercâncerdriverdriverHPVHPVintegraçãoIntegrativeO desenvolvimento de metodologias sobre integração de dados na área de biologia de sistemas é de grande importância devido ao aumento contínuo de dados resultantes de análises globais que são depositados em bancos de dados públicos. Poucas metodologias e ferramentas de bioinformática levam em consideração a diferenciação entre drivers e passengers, fundamental para a identificação de genes importantes para o desenvolvimento e progressão tumoral. Os perfis de expressão gênica têm possibilitado a identificação de assinaturas genéticas em uma grande variedade de tumores humanos. Além disso, as alterações epigenéticas, como a expressão de microRNAs (miRNA) e a metilação do DNA, também contribuem para o desenvolvimento de diversos tipos de doenças. Entretanto, a grande maioria destes estudos não mostra integração dos resultados obtidos pelas diferentes estratégias utilizadas, o que teria maior impacto na identificação de drivers moleculares. Neste estudo foi realizada a integração de quatro níveis de alterações em 31 amostras de câncer de pênis (CaPe): alteração do número de cópias do DNA, metilação de ilhas CpGs, expressão de miRNAs e expressão de transcritos codificadores. O conhecimento das alterações genéticas e epigenéticas relacionadas ao desenvolvimento de câncer de pênis é bastante limitado, devido principalmente a sua rara incidência. Uma parcela significativa dos casos de CaPe tem sido associada com a infecção pelo Papilomavírus Humano (HPV). A metodologia para integração de dados foi aplicada utilizando duas abordagens: (1) estudo das alterações em câncer de pênis (tumor e normal) independente da infecção pelo HPV e (2) estudo das alterações relacionadas à infecção pelo HPV. A análise foi dividida em duas etapas, com a seleção de genes alvos específicos da doença e inferência de módulos a partir desses alvos. Destacam-se na metodologia a seleção de genes candidatos a driver utilizando a atribuição de pesos para cada alteração seguindo critérios pré-determinados, e.g. se o gene estava presente em uma região rara, após classificação pelo DGV (Database of Genomic Variants) e a utilização desses genes como alvos para identificação das possíveis relações entre eles e os módulos. Também foi realizada a adaptação da metodologia de redes em módulos, com a inclusão de genes passengers e interação proteína-proteína (PPI) como um critério para seleção dos módulos. Essa análise se mostrou eficaz na identificação de módulos gênicos bem relacionados com os drivers, resultando na escolha de vias biológicas potencialmente responsáveis pelo desenvolvimento do tumor. Os genes identificados após a comparação entre amostras tumorais e normais (SOX17, TWIST1, CAV1, PPARG, FLI1 e TNFSF10) e no estudo entre amostras positivas e negativas para infecção pelo HPV (PCNA, SOX14 e RFC4) foram validados in situ por técnicas independentes. Para validação in silico das alterações encontradas na metodologia de integração de dados e para validação da metodologia de redes em módulos foram utilizadas 255 amostras de glioblastoma multiforme obtidas no banco de dados TCGA (The Cancer Genome Atlas). Foram identificadas vias biológicas importantes relacionadas ao processo tumoral, como regulação do crescimento celular (GO:0001558, p=0,0062), homeostase (GO:0048872, $p=0,0082) e regulação da transcrição (GO:0003700, p=0,00089). Também foi realizada uma meta-análise utilizando amostras do TCGA, que encontrou um perfil similar de expressão para os genes CAV1, DLC1,FLI1, MSX1, NRN1, PML, PPARG e SOX17 (T vs N) e PCNA e RFC4 (HPV+ vs HPV-). Para o nosso conhecimento, esse é o primeiro estudo em CaPe utilizando análise integrada de quatro níveis de alteração. Além disso, foram encontradas alterações não randômicas capazes de modificar transcritos específicos e contribuir para o conhecimento da patobiologia dos tumores de pênis.Methodologies for data integration in systems biology area have great importance due to continuous increase of public data resulting from large-scale analysis, which are deposited in public databases. Few methodologies and bioinformatics tools take into consideration the differentiation between drivers and passengers, fundamental for the identification of important genes for tumor development and progression. The gene expression profiles have allowed the identification of genetic signatures in a wide variety of human tumors. In addition, epigenetic changes, such as the expression of microRNA (miRNA) and DNA methylation, also contribute to the development of a veriety of diseases. However, most of these studies did not show integration of results obtained by different strategies used, which would have increased impact to identify molecular drivers. This study provides a methodology for integration of four levels of changes in 31 samples of penile cancer (PeCa): copy number alterations, DNA methylation of CpG islands, miRNA expression and gene expression of coding transcripts. Knowledge about genetic and epigenetic changes related to the development of penile cancer is very limited, mainly due to its rare incidence. A significant portion of PeCa samples has been associated with infection by Human papillomavirus (HPV). The methodology for integrative data was applied using two approaches: (1) the study considering alterations in penile carcinoma (tumor and normal), independent of HPV infection and (2) the study considering alteration related to HPV infection in PeCa. In each study, the methodology was divided into two stages, with the selection of target genes and the inference of disease specific modules from these targets. It is highlighted in the methodology the selection of candidate genes using the driver assigning weights to each change following predetermined criteria, e.g if the gene was present in a rare region after classification using the DGV database (Database of Genomic Variants) and the use of these genes as seeds for identification of possible relationships between them and the modules. For this, another contribution of this study was the adaptation of module network methodology, with the inclusion of passengers genes and protein-protein interaction (PPI) as a criteria to select the modules. This analysis was effective in identifying gene modules and related drivers, resulting in the choice of biological pathway potentially responsible for the tumor development. The genes identified after comparing tumor and normal samples (SOX17, TWIST1, CAV1, PPARG, FLI1 and TNFSF10) and the genes identified in the study of positive and negative samples for HPV infection (PCNA, SOX14 and RFC4) were validated in situ by independent techniques. For in silico validation of the changes found in the integrative methodology and the modules network were used 255 samples of glioblastoma multiforme obtained at TCGA database (The Cancer Genome Atlas). Biological pathways have been identified related to the tumoral process, such as cell growth regulation (GO:0001558, p=0,0062), homeostasis (GO:0048872, p=0,0082) and transcription regulation (GO:0003700, p=0,00089). Also, a meta-analysis was performed using samples from TCGA, who found a similar expression profile for CAV1, DLC1, FLI1, MSX1, NRN1, PML, PPARG and SOX17 (T vs N) and PCNA and RFC4 genes (HPV + vs HPV-). To our knowledge, this is the first integrative analysis in PeCa using a four-level of gene alterations. In addition, it was found non-random alterations capable to modifying specific transcripts and contribute to the knowledge about the pathobiology of penile tumors.Biblioteca Digitais de Teses e Dissertações da USPRogatto, Silvia ReginaMarchi, Fabio Albuquerque2014-04-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-24062014-110926/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:11:49Zoai:teses.usp.br:tde-24062014-110926Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:11:49Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
Integrative methodology in penile carcinomas
title Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
spellingShingle Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
Marchi, Fabio Albuquerque
cancer
câncer
driver
driver
HPV
HPV
integração
Integrative
title_short Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
title_full Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
title_fullStr Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
title_full_unstemmed Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
title_sort Metodologia para integração de dados genômicos, transcriptômicos e epigenéticos de câncer de pênis
author Marchi, Fabio Albuquerque
author_facet Marchi, Fabio Albuquerque
author_role author
dc.contributor.none.fl_str_mv Rogatto, Silvia Regina
dc.contributor.author.fl_str_mv Marchi, Fabio Albuquerque
dc.subject.por.fl_str_mv cancer
câncer
driver
driver
HPV
HPV
integração
Integrative
topic cancer
câncer
driver
driver
HPV
HPV
integração
Integrative
description O desenvolvimento de metodologias sobre integração de dados na área de biologia de sistemas é de grande importância devido ao aumento contínuo de dados resultantes de análises globais que são depositados em bancos de dados públicos. Poucas metodologias e ferramentas de bioinformática levam em consideração a diferenciação entre drivers e passengers, fundamental para a identificação de genes importantes para o desenvolvimento e progressão tumoral. Os perfis de expressão gênica têm possibilitado a identificação de assinaturas genéticas em uma grande variedade de tumores humanos. Além disso, as alterações epigenéticas, como a expressão de microRNAs (miRNA) e a metilação do DNA, também contribuem para o desenvolvimento de diversos tipos de doenças. Entretanto, a grande maioria destes estudos não mostra integração dos resultados obtidos pelas diferentes estratégias utilizadas, o que teria maior impacto na identificação de drivers moleculares. Neste estudo foi realizada a integração de quatro níveis de alterações em 31 amostras de câncer de pênis (CaPe): alteração do número de cópias do DNA, metilação de ilhas CpGs, expressão de miRNAs e expressão de transcritos codificadores. O conhecimento das alterações genéticas e epigenéticas relacionadas ao desenvolvimento de câncer de pênis é bastante limitado, devido principalmente a sua rara incidência. Uma parcela significativa dos casos de CaPe tem sido associada com a infecção pelo Papilomavírus Humano (HPV). A metodologia para integração de dados foi aplicada utilizando duas abordagens: (1) estudo das alterações em câncer de pênis (tumor e normal) independente da infecção pelo HPV e (2) estudo das alterações relacionadas à infecção pelo HPV. A análise foi dividida em duas etapas, com a seleção de genes alvos específicos da doença e inferência de módulos a partir desses alvos. Destacam-se na metodologia a seleção de genes candidatos a driver utilizando a atribuição de pesos para cada alteração seguindo critérios pré-determinados, e.g. se o gene estava presente em uma região rara, após classificação pelo DGV (Database of Genomic Variants) e a utilização desses genes como alvos para identificação das possíveis relações entre eles e os módulos. Também foi realizada a adaptação da metodologia de redes em módulos, com a inclusão de genes passengers e interação proteína-proteína (PPI) como um critério para seleção dos módulos. Essa análise se mostrou eficaz na identificação de módulos gênicos bem relacionados com os drivers, resultando na escolha de vias biológicas potencialmente responsáveis pelo desenvolvimento do tumor. Os genes identificados após a comparação entre amostras tumorais e normais (SOX17, TWIST1, CAV1, PPARG, FLI1 e TNFSF10) e no estudo entre amostras positivas e negativas para infecção pelo HPV (PCNA, SOX14 e RFC4) foram validados in situ por técnicas independentes. Para validação in silico das alterações encontradas na metodologia de integração de dados e para validação da metodologia de redes em módulos foram utilizadas 255 amostras de glioblastoma multiforme obtidas no banco de dados TCGA (The Cancer Genome Atlas). Foram identificadas vias biológicas importantes relacionadas ao processo tumoral, como regulação do crescimento celular (GO:0001558, p=0,0062), homeostase (GO:0048872, $p=0,0082) e regulação da transcrição (GO:0003700, p=0,00089). Também foi realizada uma meta-análise utilizando amostras do TCGA, que encontrou um perfil similar de expressão para os genes CAV1, DLC1,FLI1, MSX1, NRN1, PML, PPARG e SOX17 (T vs N) e PCNA e RFC4 (HPV+ vs HPV-). Para o nosso conhecimento, esse é o primeiro estudo em CaPe utilizando análise integrada de quatro níveis de alteração. Além disso, foram encontradas alterações não randômicas capazes de modificar transcritos específicos e contribuir para o conhecimento da patobiologia dos tumores de pênis.
publishDate 2014
dc.date.none.fl_str_mv 2014-04-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/95/95131/tde-24062014-110926/
url http://www.teses.usp.br/teses/disponiveis/95/95131/tde-24062014-110926/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257306709884928