Study of the association of differential allelic expression with breast cancer clinical features
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.1/19682 |
Resumo: | Genome-wide association studies have identified thousands of low-risk variants associated with BC. Since most associated variants are in non-coding regions of the genome and can be in linkage disequilibrium with many others, it’s difficult to pinpoint the true causal variant and its target gene. Post-GWAS functional analysis have shown that altering the expression of genes by cis-acting variants is a common mechanism involved in risk for breast cancer (BC). Therefore, we hypothesize that germline cis-regulatory variants may determine/contribute to tumour clinical features. We propose to test the association of allelic expression (AE) ratios with BC tumours clinical features and patient’s survival. Differences in allelic ratios distributions between tumours with different molecular profiles would indicate a different genetic background for cis-regulatory variants between these tumours. To perform this analysis, we used The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) normal-matched dataset, and with the R programming language, we complemented this data with allelic expression ratios in various SNPs previously calculated, resulting in a dataset of 105 patients with both clinical and AE data. We identified 63 variants displaying significant effect sizes (|Hedges’s G| ≥ 0.5, 95% interval not crossing 0) for ER statuses, 119 for PR status and 58 for HER2 status, some of them associated with two receptor statuses. Only one variant (rs3764859 in COQ6 and ENTPD5 genes) was found statistically associated with ER status after correction for multiple testing (q-value ≤ 0.1). Additionally, six of the variants were also associated with survival including rs2236225, a variant located at gene MTHFD1 that showed a larger expression difference in both negative ER and PR populations compared to their positive counterparts. We found evidence that cis-acting variants may determine BC clinical features and disease development, and therefore BC subtypes. However, these findings need to be replicated in an independent dataset to be validated. |
id |
RCAP_a0c43cfa5575ad37d02d32e36012d662 |
---|---|
oai_identifier_str |
oai:sapientia.ualg.pt:10400.1/19682 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Study of the association of differential allelic expression with breast cancer clinical featuresAllelic expression (ae) analysisBreast cancerCis-regulationTumours clinical featuresDomínio/Área Científica::Ciências Médicas::Outras Ciências MédicasGenome-wide association studies have identified thousands of low-risk variants associated with BC. Since most associated variants are in non-coding regions of the genome and can be in linkage disequilibrium with many others, it’s difficult to pinpoint the true causal variant and its target gene. Post-GWAS functional analysis have shown that altering the expression of genes by cis-acting variants is a common mechanism involved in risk for breast cancer (BC). Therefore, we hypothesize that germline cis-regulatory variants may determine/contribute to tumour clinical features. We propose to test the association of allelic expression (AE) ratios with BC tumours clinical features and patient’s survival. Differences in allelic ratios distributions between tumours with different molecular profiles would indicate a different genetic background for cis-regulatory variants between these tumours. To perform this analysis, we used The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) normal-matched dataset, and with the R programming language, we complemented this data with allelic expression ratios in various SNPs previously calculated, resulting in a dataset of 105 patients with both clinical and AE data. We identified 63 variants displaying significant effect sizes (|Hedges’s G| ≥ 0.5, 95% interval not crossing 0) for ER statuses, 119 for PR status and 58 for HER2 status, some of them associated with two receptor statuses. Only one variant (rs3764859 in COQ6 and ENTPD5 genes) was found statistically associated with ER status after correction for multiple testing (q-value ≤ 0.1). Additionally, six of the variants were also associated with survival including rs2236225, a variant located at gene MTHFD1 that showed a larger expression difference in both negative ER and PR populations compared to their positive counterparts. We found evidence that cis-acting variants may determine BC clinical features and disease development, and therefore BC subtypes. However, these findings need to be replicated in an independent dataset to be validated.O cancro da mama feminino representa 11,7% de incidência de cancro a nível mundial, constituindo o cancro mais comum, reclamando 6,9% da mortalidade mundial associada com cancro. Em Portugal, o cancro da mama é a neoplasia mais comum nas mulheres (26,4%) sendo responsável pela maior fração de mortalidade feminina relacionada com cancro (15,5%). A biologia tumoral e quadro clínico fazem o cancro da mama uma doença heterogénea, que pode ser subdividida em diferentes subtipos de tumor da mama com perfis de expressão génica distintos. É também uma doença complexa que engloba fatores de risco ambientais e genéticos na sua etiologia. Estudos de associação do genoma completo (GWAS) já identificaram milhares de variantes de baixo risco associadas com cancro da mama, e inclusive, quatro subtipos específicos de tumores. Contudo, a maioria das variantes associadas estão em regiões não codificantes do genoma, e cada variante identificada pode estar em desequilíbrio de ligação (LD) com outras variantes, o que dificulta localizar verdadeira a variante causal e o seu gene alvo com precisão e confiança. A importância e valor intrísico deste estudo consiste na identificação de variantes que podem estar associadas a cancro da mama e os seus subtipos. Estas associações acarretam implicações e ramificações importantes para o estudo da patologia em questão, uma vez que podem elucidar mecanismos de atuação da doença bem como a biologia de mesma. Esta melhor compreensão permite prever como e que o carcinoma evolui em populações de subtipos específicos e de que forma esta pode responder a terapia de acordo com as mutações adquiridas. O cancro da mama, pode apresentar combinações específicas de caraterísticas moleculares e devido a essa peculiaridade, é possível agrupar os tumores em subtipos de cancro da mama que expressam e deixam de expressar uma gama de recetores, originando uma chave de expressão génica tumoral. O subtipo mais comum é identificado como Luminal A e carateriza-se pela maior expressão dos recetores de estrogénio (ER) e progesterona (PR) enquanto a expressão de recetor tipo 2 do fator de crescimento epidérmico humano (HER2) está reduzida. Por ordem de maior para menor incidência, o Luminal A (ER+/PR+/HER2-) é seguido por Luminal B (ER+/PR-/HER2+), Triplo Negativo (ER-/PR-/HER2-) e HER2-enriquecido (HER2+). A maioria dos casos de cancro da mama são esporádicos, contudo cerca de 20%-30% apresentam hereditariedade, dos quais 5-10% apresentam uma forte componente herdada e um risco acrescido. Esta componente herdada tem diferentes graus de risco para o seu portador, que pode chegar a um risco acrescido de 10 a 20 vezes, como no caso dos portadores de mutações patogénicas nos genes BRCA1 e BRCA2, apesar de conjuntamente apresentarem uma frequência apenas de 0.4% em cancro da mama. Num grau intermédio, mutações em genes como CHEK2 e ATM conferem o dobro do risco de cancro da mama, e por último, as componentes hereditárias de baixo risco (inferior a 1.5) são normalmente causadas por polimorfismos de nucleótido único (SNP) como o polimorfismo Pro919Ser no gene BRIP1. A introdução dos estudos de associação do genoma inteiro possibilitou a descoberta de centenas de variantes de baixo risco associadas com cancro da mama, e também associadas especificamente com subtipos moleculares de cancro da mama, que apresentam sobre ou subre expressão de recetores hormonais. A análise funcional pós-GWAS das variantes associadas a risco demonstrou que a alteração da expressão génica por variantes cis-regulatórias constitui um mecanismo comum envolvido em risco para cancro da mama. Estas variantes regulam a expressão dos genes de um modo específico para cada um dos alelos do gene, estando geralmente associados a regiões regulatórias como promotores ou enhancers. Consequentemente, propusémos a hipótese que as variantes cis-regulatórias na linha germinal podem não só contribuir para risco mas também para determinar as características tumorais e quadro clínico do paciente. Para responder a esta pergunta, testámos a associação dos rácios de expressão alélica (AE) - um valor que mede diretamente o efeito de variantes cis-regulatórias – com caraterísticas clínicas de tumores da mama e sobrevivência dos pacientes. De modo a efetuar esta análise, foi utilizado o conjunto de dados The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) tecido normal-tumoral adjacente, para o qual possuímos dados de rácios de expressão alélica para vários polimorfismos de nucleótido único localizados em regiões transcritas de genes, assim como informação clínica para 105 indivíduos. Testámos estatisticamente (recorrendo a linguagem de programação R) a associação entre rácios de expressão alélica (AE) medidos em 8039 SNPs expressos (aeSNPs) num número variável de indivíduos heterozigóticos para estas variantes, e a presença ou ausência dos recetores de estrogénio (ER), progesterona (PR) e sobre-expressão do fator de crescimento epidérmico humano 2 (HER2). Para esta análise aplicou-se o teste t de Student para variantes com rácios de AE que seguiam uma distribuição normal ou Mann-Whitney para variantes cujos rácios de AE apresentavam uma distribuição não normal, de acordo com os resultados do teste de normalidade Shapiro-Wilk. De forma a quantificar o tamanho de efeito (“effect size”) de AE entre tumores com presença ou ausência de receptores, utilizou-se o teste de Hedges’ G. A análise de sobrevivência de acordo com os rácios de AE foi executada nos aeSNPs que apresentavam um tamanho de efeito significativo, usando um teste Two Stage Hazard Rate Comparison (TSHRC). Identificámos 63 variantes que demonstravam tamanhos de efeito significantes de acordo com a presença/ausência de ER, 119 de PR e 58 sobre-expressão de HER2, e alguns destes, inclusive, associados com mais do que um recetor. Apenas uma variante (rs3764859 localizada nos genes COQ6 e ENTPD5) apresentou-se estatisticamente associada com a presença/ausência do recetor de estrogénio após correção para testes múltiplos (q-value ≤ 0.1). Uma variante em particular - rs2236225, demonstrou uma elevada diferença na distribuição dos rácios de AE nas populações ER e PR negativas quando comparadas com a fração positiva e já foi previamente associada com mau prognóstico em mulheres na pré menopausa. Finalmente, 6 aeSNPs apresentavam valores de sobrevida livre de doença diferentes entre populações com rácios de expressão alélica opostos de acordo com o TSHRC. Neste trabalho encontrámos evidências de que as variantes cis-regulatórias podem determinar caraterísticas de cancro da mama e do desenvolvimento da doença, e consequentemente de subtipos moleculares de cancro da mama. Contudo, estas descobertas precisam de ser replicadas de uma forma independente noutro conjunto de dados de forma a serem validadas. Outro tipo de estudos também será necessário para mapear as variantes cis-regulatórias cujos efeitos encontrámos associados com a biologia dos tumores, e revelar qual o seu mecanismo de regulação génica inerente. Este estudo demonstra o potencial de integrar análise de expressão alélica com informação clínica para melhor compreender a etiologia dos diferentes subtipos moleculaers de cancro da mama.Xavier, JoanaMaia, Ana TeresaSapientiaGóis, António Manuel Lourenço de2023-03-082026-03-03T00:00:00Z2023-03-08T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.1/19682TID:203319583enginfo:eu-repo/semantics/embargoedAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-24T10:32:11Zoai:sapientia.ualg.pt:10400.1/19682Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T20:09:16.103641Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Study of the association of differential allelic expression with breast cancer clinical features |
title |
Study of the association of differential allelic expression with breast cancer clinical features |
spellingShingle |
Study of the association of differential allelic expression with breast cancer clinical features Góis, António Manuel Lourenço de Allelic expression (ae) analysis Breast cancer Cis-regulation Tumours clinical features Domínio/Área Científica::Ciências Médicas::Outras Ciências Médicas |
title_short |
Study of the association of differential allelic expression with breast cancer clinical features |
title_full |
Study of the association of differential allelic expression with breast cancer clinical features |
title_fullStr |
Study of the association of differential allelic expression with breast cancer clinical features |
title_full_unstemmed |
Study of the association of differential allelic expression with breast cancer clinical features |
title_sort |
Study of the association of differential allelic expression with breast cancer clinical features |
author |
Góis, António Manuel Lourenço de |
author_facet |
Góis, António Manuel Lourenço de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Xavier, Joana Maia, Ana Teresa Sapientia |
dc.contributor.author.fl_str_mv |
Góis, António Manuel Lourenço de |
dc.subject.por.fl_str_mv |
Allelic expression (ae) analysis Breast cancer Cis-regulation Tumours clinical features Domínio/Área Científica::Ciências Médicas::Outras Ciências Médicas |
topic |
Allelic expression (ae) analysis Breast cancer Cis-regulation Tumours clinical features Domínio/Área Científica::Ciências Médicas::Outras Ciências Médicas |
description |
Genome-wide association studies have identified thousands of low-risk variants associated with BC. Since most associated variants are in non-coding regions of the genome and can be in linkage disequilibrium with many others, it’s difficult to pinpoint the true causal variant and its target gene. Post-GWAS functional analysis have shown that altering the expression of genes by cis-acting variants is a common mechanism involved in risk for breast cancer (BC). Therefore, we hypothesize that germline cis-regulatory variants may determine/contribute to tumour clinical features. We propose to test the association of allelic expression (AE) ratios with BC tumours clinical features and patient’s survival. Differences in allelic ratios distributions between tumours with different molecular profiles would indicate a different genetic background for cis-regulatory variants between these tumours. To perform this analysis, we used The Cancer Genome Atlas – Breast Cancer (TCGA-BRCA) normal-matched dataset, and with the R programming language, we complemented this data with allelic expression ratios in various SNPs previously calculated, resulting in a dataset of 105 patients with both clinical and AE data. We identified 63 variants displaying significant effect sizes (|Hedges’s G| ≥ 0.5, 95% interval not crossing 0) for ER statuses, 119 for PR status and 58 for HER2 status, some of them associated with two receptor statuses. Only one variant (rs3764859 in COQ6 and ENTPD5 genes) was found statistically associated with ER status after correction for multiple testing (q-value ≤ 0.1). Additionally, six of the variants were also associated with survival including rs2236225, a variant located at gene MTHFD1 that showed a larger expression difference in both negative ER and PR populations compared to their positive counterparts. We found evidence that cis-acting variants may determine BC clinical features and disease development, and therefore BC subtypes. However, these findings need to be replicated in an independent dataset to be validated. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-03-08 2023-03-08T00:00:00Z 2026-03-03T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.1/19682 TID:203319583 |
url |
http://hdl.handle.net/10400.1/19682 |
identifier_str_mv |
TID:203319583 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/embargoedAccess |
eu_rights_str_mv |
embargoedAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799133340416081920 |