Study of the association of differential allelic expression with breast cancer clinical features

Detalhes bibliográficos
Autor(a) principal: Góis, António Manuel Lourenço de
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.1/19682
Resumo: Genome-wide association studies have identified thousands of low-risk variants associated with BC. Since most associated variants are in non-coding regions of the genome and can be in linkage disequilibrium with many others, it’s difficult to pinpoint the true causal variant and its target gene. Post-GWAS functional analysis have shown that altering the expression of genes by cis-acting variants is a common mechanism involved in risk for breast cancer (BC). Therefore, we hypothesize that germline cis-regulatory variants may determine/contribute to tumour clinical features. We propose to test the association of allelic expression (AE) ratios with BC tumours clinical features and patient’s survival. Differences in allelic ratios distributions between tumours with different molecular profiles would indicate a different genetic background for cis-regulatory variants between these tumours. To perform this analysis, we used The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) normal-matched dataset, and with the R programming language, we complemented this data with allelic expression ratios in various SNPs previously calculated, resulting in a dataset of 105 patients with both clinical and AE data. We identified 63 variants displaying significant effect sizes (|Hedges’s G| ≥ 0.5, 95% interval not crossing 0) for ER statuses, 119 for PR status and 58 for HER2 status, some of them associated with two receptor statuses. Only one variant (rs3764859 in COQ6 and ENTPD5 genes) was found statistically associated with ER status after correction for multiple testing (q-value ≤ 0.1). Additionally, six of the variants were also associated with survival including rs2236225, a variant located at gene MTHFD1 that showed a larger expression difference in both negative ER and PR populations compared to their positive counterparts. We found evidence that cis-acting variants may determine BC clinical features and disease development, and therefore BC subtypes. However, these findings need to be replicated in an independent dataset to be validated.
id RCAP_a0c43cfa5575ad37d02d32e36012d662
oai_identifier_str oai:sapientia.ualg.pt:10400.1/19682
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Study of the association of differential allelic expression with breast cancer clinical featuresAllelic expression (ae) analysisBreast cancerCis-regulationTumours clinical featuresDomínio/Área Científica::Ciências Médicas::Outras Ciências MédicasGenome-wide association studies have identified thousands of low-risk variants associated with BC. Since most associated variants are in non-coding regions of the genome and can be in linkage disequilibrium with many others, it’s difficult to pinpoint the true causal variant and its target gene. Post-GWAS functional analysis have shown that altering the expression of genes by cis-acting variants is a common mechanism involved in risk for breast cancer (BC). Therefore, we hypothesize that germline cis-regulatory variants may determine/contribute to tumour clinical features. We propose to test the association of allelic expression (AE) ratios with BC tumours clinical features and patient’s survival. Differences in allelic ratios distributions between tumours with different molecular profiles would indicate a different genetic background for cis-regulatory variants between these tumours. To perform this analysis, we used The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) normal-matched dataset, and with the R programming language, we complemented this data with allelic expression ratios in various SNPs previously calculated, resulting in a dataset of 105 patients with both clinical and AE data. We identified 63 variants displaying significant effect sizes (|Hedges’s G| ≥ 0.5, 95% interval not crossing 0) for ER statuses, 119 for PR status and 58 for HER2 status, some of them associated with two receptor statuses. Only one variant (rs3764859 in COQ6 and ENTPD5 genes) was found statistically associated with ER status after correction for multiple testing (q-value ≤ 0.1). Additionally, six of the variants were also associated with survival including rs2236225, a variant located at gene MTHFD1 that showed a larger expression difference in both negative ER and PR populations compared to their positive counterparts. We found evidence that cis-acting variants may determine BC clinical features and disease development, and therefore BC subtypes. However, these findings need to be replicated in an independent dataset to be validated.O cancro da mama feminino representa 11,7% de incidência de cancro a nível mundial, constituindo o cancro mais comum, reclamando 6,9% da mortalidade mundial associada com cancro. Em Portugal, o cancro da mama é a neoplasia mais comum nas mulheres (26,4%) sendo responsável pela maior fração de mortalidade feminina relacionada com cancro (15,5%). A biologia tumoral e quadro clínico fazem o cancro da mama uma doença heterogénea, que pode ser subdividida em diferentes subtipos de tumor da mama com perfis de expressão génica distintos. É também uma doença complexa que engloba fatores de risco ambientais e genéticos na sua etiologia. Estudos de associação do genoma completo (GWAS) já identificaram milhares de variantes de baixo risco associadas com cancro da mama, e inclusive, quatro subtipos específicos de tumores. Contudo, a maioria das variantes associadas estão em regiões não codificantes do genoma, e cada variante identificada pode estar em desequilíbrio de ligação (LD) com outras variantes, o que dificulta localizar verdadeira a variante causal e o seu gene alvo com precisão e confiança. A importância e valor intrísico deste estudo consiste na identificação de variantes que podem estar associadas a cancro da mama e os seus subtipos. Estas associações acarretam implicações e ramificações importantes para o estudo da patologia em questão, uma vez que podem elucidar mecanismos de atuação da doença bem como a biologia de mesma. Esta melhor compreensão permite prever como e que o carcinoma evolui em populações de subtipos específicos e de que forma esta pode responder a terapia de acordo com as mutações adquiridas. O cancro da mama, pode apresentar combinações específicas de caraterísticas moleculares e devido a essa peculiaridade, é possível agrupar os tumores em subtipos de cancro da mama que expressam e deixam de expressar uma gama de recetores, originando uma chave de expressão génica tumoral. O subtipo mais comum é identificado como Luminal A e carateriza-se pela maior expressão dos recetores de estrogénio (ER) e progesterona (PR) enquanto a expressão de recetor tipo 2 do fator de crescimento epidérmico humano (HER2) está reduzida. Por ordem de maior para menor incidência, o Luminal A (ER+/PR+/HER2-) é seguido por Luminal B (ER+/PR-/HER2+), Triplo Negativo (ER-/PR-/HER2-) e HER2-enriquecido (HER2+). A maioria dos casos de cancro da mama são esporádicos, contudo cerca de 20%-30% apresentam hereditariedade, dos quais 5-10% apresentam uma forte componente herdada e um risco acrescido. Esta componente herdada tem diferentes graus de risco para o seu portador, que pode chegar a um risco acrescido de 10 a 20 vezes, como no caso dos portadores de mutações patogénicas nos genes BRCA1 e BRCA2, apesar de conjuntamente apresentarem uma frequência apenas de 0.4% em cancro da mama. Num grau intermédio, mutações em genes como CHEK2 e ATM conferem o dobro do risco de cancro da mama, e por último, as componentes hereditárias de baixo risco (inferior a 1.5) são normalmente causadas por polimorfismos de nucleótido único (SNP) como o polimorfismo Pro919Ser no gene BRIP1. A introdução dos estudos de associação do genoma inteiro possibilitou a descoberta de centenas de variantes de baixo risco associadas com cancro da mama, e também associadas especificamente com subtipos moleculares de cancro da mama, que apresentam sobre ou subre expressão de recetores hormonais. A análise funcional pós-GWAS das variantes associadas a risco demonstrou que a alteração da expressão génica por variantes cis-regulatórias constitui um mecanismo comum envolvido em risco para cancro da mama. Estas variantes regulam a expressão dos genes de um modo específico para cada um dos alelos do gene, estando geralmente associados a regiões regulatórias como promotores ou enhancers. Consequentemente, propusémos a hipótese que as variantes cis-regulatórias na linha germinal podem não só contribuir para risco mas também para determinar as características tumorais e quadro clínico do paciente. Para responder a esta pergunta, testámos a associação dos rácios de expressão alélica (AE) - um valor que mede diretamente o efeito de variantes cis-regulatórias – com caraterísticas clínicas de tumores da mama e sobrevivência dos pacientes. De modo a efetuar esta análise, foi utilizado o conjunto de dados The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) tecido normal-tumoral adjacente, para o qual possuímos dados de rácios de expressão alélica para vários polimorfismos de nucleótido único localizados em regiões transcritas de genes, assim como informação clínica para 105 indivíduos. Testámos estatisticamente (recorrendo a linguagem de programação R) a associação entre rácios de expressão alélica (AE) medidos em 8039 SNPs expressos (aeSNPs) num número variável de indivíduos heterozigóticos para estas variantes, e a presença ou ausência dos recetores de estrogénio (ER), progesterona (PR) e sobre-expressão do fator de crescimento epidérmico humano 2 (HER2). Para esta análise aplicou-se o teste t de Student para variantes com rácios de AE que seguiam uma distribuição normal ou Mann-Whitney para variantes cujos rácios de AE apresentavam uma distribuição não normal, de acordo com os resultados do teste de normalidade Shapiro-Wilk. De forma a quantificar o tamanho de efeito (“effect size”) de AE entre tumores com presença ou ausência de receptores, utilizou-se o teste de Hedges’ G. A análise de sobrevivência de acordo com os rácios de AE foi executada nos aeSNPs que apresentavam um tamanho de efeito significativo, usando um teste Two Stage Hazard Rate Comparison (TSHRC). Identificámos 63 variantes que demonstravam tamanhos de efeito significantes de acordo com a presença/ausência de ER, 119 de PR e 58 sobre-expressão de HER2, e alguns destes, inclusive, associados com mais do que um recetor. Apenas uma variante (rs3764859 localizada nos genes COQ6 e ENTPD5) apresentou-se estatisticamente associada com a presença/ausência do recetor de estrogénio após correção para testes múltiplos (q-value ≤ 0.1). Uma variante em particular - rs2236225, demonstrou uma elevada diferença na distribuição dos rácios de AE nas populações ER e PR negativas quando comparadas com a fração positiva e já foi previamente associada com mau prognóstico em mulheres na pré menopausa. Finalmente, 6 aeSNPs apresentavam valores de sobrevida livre de doença diferentes entre populações com rácios de expressão alélica opostos de acordo com o TSHRC. Neste trabalho encontrámos evidências de que as variantes cis-regulatórias podem determinar caraterísticas de cancro da mama e do desenvolvimento da doença, e consequentemente de subtipos moleculares de cancro da mama. Contudo, estas descobertas precisam de ser replicadas de uma forma independente noutro conjunto de dados de forma a serem validadas. Outro tipo de estudos também será necessário para mapear as variantes cis-regulatórias cujos efeitos encontrámos associados com a biologia dos tumores, e revelar qual o seu mecanismo de regulação génica inerente. Este estudo demonstra o potencial de integrar análise de expressão alélica com informação clínica para melhor compreender a etiologia dos diferentes subtipos moleculaers de cancro da mama.Xavier, JoanaMaia, Ana TeresaSapientiaGóis, António Manuel Lourenço de2023-03-082026-03-03T00:00:00Z2023-03-08T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.1/19682TID:203319583enginfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-24T10:32:11Zoai:sapientia.ualg.pt:10400.1/19682Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:09:16.103641Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Study of the association of differential allelic expression with breast cancer clinical features
title Study of the association of differential allelic expression with breast cancer clinical features
spellingShingle Study of the association of differential allelic expression with breast cancer clinical features
Góis, António Manuel Lourenço de
Allelic expression (ae) analysis
Breast cancer
Cis-regulation
Tumours clinical features
Domínio/Área Científica::Ciências Médicas::Outras Ciências Médicas
title_short Study of the association of differential allelic expression with breast cancer clinical features
title_full Study of the association of differential allelic expression with breast cancer clinical features
title_fullStr Study of the association of differential allelic expression with breast cancer clinical features
title_full_unstemmed Study of the association of differential allelic expression with breast cancer clinical features
title_sort Study of the association of differential allelic expression with breast cancer clinical features
author Góis, António Manuel Lourenço de
author_facet Góis, António Manuel Lourenço de
author_role author
dc.contributor.none.fl_str_mv Xavier, Joana
Maia, Ana Teresa
Sapientia
dc.contributor.author.fl_str_mv Góis, António Manuel Lourenço de
dc.subject.por.fl_str_mv Allelic expression (ae) analysis
Breast cancer
Cis-regulation
Tumours clinical features
Domínio/Área Científica::Ciências Médicas::Outras Ciências Médicas
topic Allelic expression (ae) analysis
Breast cancer
Cis-regulation
Tumours clinical features
Domínio/Área Científica::Ciências Médicas::Outras Ciências Médicas
description Genome-wide association studies have identified thousands of low-risk variants associated with BC. Since most associated variants are in non-coding regions of the genome and can be in linkage disequilibrium with many others, it’s difficult to pinpoint the true causal variant and its target gene. Post-GWAS functional analysis have shown that altering the expression of genes by cis-acting variants is a common mechanism involved in risk for breast cancer (BC). Therefore, we hypothesize that germline cis-regulatory variants may determine/contribute to tumour clinical features. We propose to test the association of allelic expression (AE) ratios with BC tumours clinical features and patient’s survival. Differences in allelic ratios distributions between tumours with different molecular profiles would indicate a different genetic background for cis-regulatory variants between these tumours. To perform this analysis, we used The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) normal-matched dataset, and with the R programming language, we complemented this data with allelic expression ratios in various SNPs previously calculated, resulting in a dataset of 105 patients with both clinical and AE data. We identified 63 variants displaying significant effect sizes (|Hedges’s G| ≥ 0.5, 95% interval not crossing 0) for ER statuses, 119 for PR status and 58 for HER2 status, some of them associated with two receptor statuses. Only one variant (rs3764859 in COQ6 and ENTPD5 genes) was found statistically associated with ER status after correction for multiple testing (q-value ≤ 0.1). Additionally, six of the variants were also associated with survival including rs2236225, a variant located at gene MTHFD1 that showed a larger expression difference in both negative ER and PR populations compared to their positive counterparts. We found evidence that cis-acting variants may determine BC clinical features and disease development, and therefore BC subtypes. However, these findings need to be replicated in an independent dataset to be validated.
publishDate 2023
dc.date.none.fl_str_mv 2023-03-08
2023-03-08T00:00:00Z
2026-03-03T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.1/19682
TID:203319583
url http://hdl.handle.net/10400.1/19682
identifier_str_mv TID:203319583
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799133340416081920