Genomic and transcriptomic analyses in cancers related with viral infection
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | https://hdl.handle.net/1822/47439 |
Resumo: | Dissertação de mestrado em Bioinformatics |
id |
RCAP_16f834914e20918b9721ab1e7e950270 |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/47439 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Genomic and transcriptomic analyses in cancers related with viral infectionCancerViral infectionRNAseqCervical carcinomaHepatocellular carcinomaHead and neck squamous cell carcinomaCancroInfecção viralCarcinoma do colo do úteroCarcinoma hepatocelularCarcinoma da cabeça e pescoçoEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformaticsIn the past 30 years, accumulated evidence has been supporting viral infection as one factor responsible for 15-20% of human malignancies worldwide (W. S. Liang et al. 2014; McLaughlin-Drubin and Munger 2008). Studies on oncogenic viruses have proved their importance on cellular malfunction along the carcinogenic process, and showed that their association with cancer can amount from 15% to 100% (McLaughlin-Drubin and Munger 2008), depending on the type of tumour. With the large amount of genomic and metagenomic information available on public international consortia, such as TCGA database, it is nowadays possible to indirectly infer viral infections from the human centred omics studies, as a portion of the reads will align in viruses and bacteria. Taking as starting point the research made by Tang et al. 2013, we focused on cervical (CESC), hepatocellular (LIHC) and head and neck squamous cell (HNSC) carcinomas, which are known to show a high proportion of viral-positive cases (Tang et al. 2013). We downloaded RNAseq data from 309, 424 and 566 samples, respectively, and run the unmapped reads against a reference database of viruses (downloaded from NCBI) by using the tools Batch, SAMTOOLS, Bowtie and PRINTSEQ. Quantification of each virus was performed using parts per million reads (ppm) and only viruses with ppm above 10 were considered as positively infecting the sample. We confirmed that around 94% of CESC samples were infected, mostly by HPV (Human papillomavirus) and specifically by the HPV16 strain. Nearly 32% of LIHC were infected by HBV (hepatitis B virus). Almost 17% of HNSC samples were infected, and the HPV16 was the most common present virus. The evaluation of differential enrichment of metabolic pathways between infected and noninfected groups, for each cancer type, was performed in GSEA. Signs of enrichment for infection and immune related pathways were evident in CESC infected group, while in LIHC and HNSC infected groups the enrichment was mostly related with DNA replication and repair. This seems to indicate that infection is especially active in CESC, contradicting previous claims that tumorigenesis in cervix was not directly linked with infection. For the three cancer types, the viruses integrate their genome in the host genome, affecting DNA replication, maintenance and repair. In our investigation of integration of HPV16 genome in one HNSC tumor sample, we confirmed integration in the human RAD51B gene that codes a protein involved in DNA repair by homologous recombination. We thus confirmed that HPV16 can act both as indirect and direct carcinogen. The infection, most probably through the integration of the viral genome in the host genome, increased the amount of somatic mutations in the infected group in LIHC, but not in HNSC where tobacco consumption is also an important carcinogen. The low number of non-infected samples in CESC did not allow a reliable evaluation of changes in the amount of somatic mutations. Even so, in both LIHC and HNSC infected groups, some somatic mutations occurred in the context of immune-related pathways, showing that they can contribute to render these individuals susceptible to infection. Also, when checking expression of HPV16 genes in five samples each from CESC and HNSC, we confirmed that E6 and E7 genes are amongst the ones more expressed in many samples, while E2 is not expressed. E6 and E7 have been said to be preferentially integrated in the host genome, while E2, which controls their expression, is not integrated or it is disrupted. It is believed that the overexpression of E6 and E7 initiates carcinogenesis. The viral infection rates inferred here from mining the omics databases are very similar to the ones evaluated by standard methods (Tang et al. 2013), showing that public international consortia can indirectly provide interesting insights into the involvement of viral infection in tumorigenesis. The high number of samples per tumor, the wide geographic origin of the samples, and the high-throughput characterisation for different omics platforms allows multilayer comparisons and evaluations, in a scale not affordable before.Nos últimos 30 anos foram-se acumulando evidências que têm vindo a apoiar a infecção viral como um factor responsável por 15-20% dos tumores malignos em humanos a nível mundial (W. S. Liang et al. 2014; McLaughlin-Drubin and Munger 2008). Estudos sobre os vírus oncogénicos demonstraram a sua importância no mau funcionamento celular ao longo do processo carcinogénico e demonstraram que a sua associação com o cancro varia entre 15% e 100% (McLaughlin-Drubin and Munger 2008), dependendo do tipo de tumor. Com a grande quantidade de informação genómica e metagenómica acessível nos consórcios internacionais públicos, tais como a base de dados TCGA, hoje em dia é possível inferir indiretamente infecções virais a partir de estudos genómicos centrados em humanos, uma vez que parte das reads irá alinhar com vírus e bactérias. Tomando como ponto de partida a pesquisa feita por Tang et al. 2013, concentramo-nos nos cancros cervical (CESC), hepatocelular (LIHC) e da cabeça e pescoço (HNSC), que são conhecidos por apresentar uma alta proporção de casos virais-positivos (Tang et al. 2013). Fizemos download de dados RNA-Seq de 309, 424 e 566 amostras, respectivamente, e comparamos unmapped reads contra uma base de dados viral de referência (retirada da base de dados do NCBI) usando as ferramentas Batch, SAMTOOLS, bowtie e PRINTSEQ. A quantificação de cada vírus foi feita usando partes por milhão (ppm) e apenas vírus com ppm acima de 10 foram considerados como estando a infectar positivamente uma amostra. Confirmamos que cerca de 94% das amostras de CESC foram infectadas, principalmente por HPV (papilomavírus humano) e, especificamente, pela estirpe HPV16. Quase 32% das amostras LIHC foram infectadas por HBV (vírus da hepatite B). E por volta de 17% de amostras HNSC foram infectadas e o HPV16 foi o vírus mais comum. A avaliação de enriquecimento diferencial de vias metabólicas entre grupos infectados e não infectados, para cada tipo de cancro, foi realizada por GSEA. Os sinais de enriquecimento para infecção e vias relacionadas com sistema imune eram evidentes no grupo infectado CESC, enquanto nos grupos infectados de LIHC e HNSC o enriquecimento era principalmente relacionado com replicação e reparação de DNA. Este facto parece indicar que a infecção é especialmente ativa no CESC, contradizendo alegações anteriores de que a tumorigenese no colo do útero não estava diretamente ligada à infecção. Nos três tipos de cancro, os vírus integraram os seus genomas no genoma do hospedeiro, afetando a replicação, manutenção e reparação do DNA. No nosso estudo sobre a integração do genoma de HPV16 numa amostra de tumor HNSC, foi confirmada a integração viral no gene humano RAD51B que codifica uma proteína implicada na reparação de DNA por recombinação homóloga. Desta forma, conseguimos confirmar que HPV16 pode atuar tanto como agente cancerígeno directo e indirecto. Provavelmente através da integração do genoma viral no genoma do hospedeiro, a infecção aumentou a quantidade de mutações somáticas no grupo de amostras infectadas em LIHC, mas não em HNSC onde o consumo de tabaco é também um importante agente cancerígeno. O reduzido número de amostras não-infectadas em CESC não permitiu uma comparação fiável da quantidade de mutações somáticas entre grupos de infectados e não-infectados. Ainda assim, nos grupos infectados de LIHC e HNSC, algumas mutações somáticas ocorreram no contexto de vias relacionadas com o sistema imunológico, mostrando que podem contribuir para tornar estes indivíduos susceptíveis à infecção. Além disso, ao verificar a expressão dos genes de HPV16 em cinco amostras de CESC e de HNSC, confirmou-se que os genes E6 e E7 estão entre os mais expressos em muitas das amostras, enquanto que o E2 não é expresso. Os genes E6 e E7 são conhecidos por serem preferencialmente integrados no genoma do hospedeiro, ao contrário do gene E2, o qual controla a expressão daqueles, que não é integrado ou é fragmentado. Acredita-se que é a sobreexpressão de E6 e E7 que inicia a carcinogénese. As taxas de infecção viral inferidas neste trabalho por mining de bases de dados omicos são muito semelhantes aos obtidos pelos métodos tradicionais (Tang et al. 2013), mostrando que a informação disponível nos consórcios internacionais públicos pode elucidar, indiretamente, sobre o envolvimento da infecção viral na tumorigénese. O elevado número de amostras por tumor, a grande variedade de origem geográfica das amostras e a caracterização de alto rendimento para diferentes plataformas omicas permitem comparações e avaliações múltiplas, numa escala não acessível anteriormente.Pereira, LuísaSoares, PedroUniversidade do MinhoFerreira, Joana Catarina da Rocha20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/47439eng201601117info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:52:16Zoai:repositorium.sdum.uminho.pt:1822/47439Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:51:21.643716Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Genomic and transcriptomic analyses in cancers related with viral infection |
title |
Genomic and transcriptomic analyses in cancers related with viral infection |
spellingShingle |
Genomic and transcriptomic analyses in cancers related with viral infection Ferreira, Joana Catarina da Rocha Cancer Viral infection RNAseq Cervical carcinoma Hepatocellular carcinoma Head and neck squamous cell carcinoma Cancro Infecção viral Carcinoma do colo do útero Carcinoma hepatocelular Carcinoma da cabeça e pescoço Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
title_short |
Genomic and transcriptomic analyses in cancers related with viral infection |
title_full |
Genomic and transcriptomic analyses in cancers related with viral infection |
title_fullStr |
Genomic and transcriptomic analyses in cancers related with viral infection |
title_full_unstemmed |
Genomic and transcriptomic analyses in cancers related with viral infection |
title_sort |
Genomic and transcriptomic analyses in cancers related with viral infection |
author |
Ferreira, Joana Catarina da Rocha |
author_facet |
Ferreira, Joana Catarina da Rocha |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pereira, Luísa Soares, Pedro Universidade do Minho |
dc.contributor.author.fl_str_mv |
Ferreira, Joana Catarina da Rocha |
dc.subject.por.fl_str_mv |
Cancer Viral infection RNAseq Cervical carcinoma Hepatocellular carcinoma Head and neck squamous cell carcinoma Cancro Infecção viral Carcinoma do colo do útero Carcinoma hepatocelular Carcinoma da cabeça e pescoço Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
topic |
Cancer Viral infection RNAseq Cervical carcinoma Hepatocellular carcinoma Head and neck squamous cell carcinoma Cancro Infecção viral Carcinoma do colo do útero Carcinoma hepatocelular Carcinoma da cabeça e pescoço Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
description |
Dissertação de mestrado em Bioinformatics |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 2016-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/47439 |
url |
https://hdl.handle.net/1822/47439 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
201601117 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133102072659968 |