Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/199014 |
Resumo: | Com a introdução do sequenciamento em massa nos testes de diagnóstico através de painéis para genes de predisposição ao câncer (GPC) houve um aumento significativo no número de variantes detectadas. Uma grande parcela destas variantes são variantes sinônimas (VS), e a maioria inferem-se serem benignas, sem passar por uma avaliação de patogenicidade. Contudo, estima-se que um menor percentual de VS é capaz de alterar a expressão gênica se estiverem inseridas em regiões conservadas, como sítios de splicing, ílhas CpG, ou ainda interferir na conformação secundária do RNA mensageiro (mRNA). Nesse trabalho, foi avaliada a acurácia de ferramentas in silico gratuitas que analisam VS. Ademais, foram avaliadas VS obtidas do banco de dados público (ExAC) e de indivíduos avaliados para genes associados a câncer hereditário. As ferramentas in silico selecionadas para as análises foram divididas em três grupos: ferramentas para análise de conservação (PhasCons e PhiloP), ferramentas de múltiplas anotações (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA e o software Silent Variant Analizer (SilVA)), e ferramentas para análise de splicing (SSF, NNSplice, MaxEntScan e GeneSplicer). Para os testes de sensibilidade e especificidade foi realizada uma curva-ROC (Receiver Operating Characteristic Curve) para cada ferramenta utilizando o software SPSS. Variantes depositadas no ClinVar e sabidamente patogênicas foram utilizadas como padrão-ouro. Foram selecionadas VS de dois grupos: o primeiro composto por variantes depositadas no banco de dados ExAC, enquanto que o segundo, era composto por variantes identificadas em indivíduos com critérios clínicos para câncer hereditário e que realizaram sequenciamento completo de TP53, BRCA1 e BRCA2 no Hospital de Clínicas de Porto Alegre. Todas as VS foram avaliadas pelos preditores que obtiveram melhores valores de sensibilidade-especificidade. A análise de estrutura secundária (ES) e diferença da energia de dobramento (ΔMEF) do mRNA foi realizada através do RNAfold e a presença de ilhas CpG pelo programa MethPrimer. Como resultados, o software SilVA apresentou a maior acurácia entre todas as ferramentas de múltiplas anotações avaliadas, e apenas o preditor GWAVA não apresentou valores significativos de área abaixo da curva (AAC) para as VS avaliadas. Todos as ferramentas de conservação e splicing apresentaram valores significativos AAC. Do total de 4.324 VS selecionadas a partir do ExAC, aproximadamente 1% destas foram preditas como provavelmente ou possivelmente patogênicas pelo software SilVA. Análises adicionais demonstraram que alteração no splicing deve ser o principal 6 mecanismo de patogenicidade presente nesse grupo. Em relação as VS identificadas no segundo grupo de estudo, foram selecionadas VS cuja frequência populacional era inferior a 0,05. Quatorze variantes sinônimas em TP53 (n=3), BRCA1 (n=2) e BRCA2 (n=9) foram selecionadas para a análise por ferramentas in silico. As análises estruturais de dobramento do mRNA demonstraram que duas VS identificadas em TP53 (c.66A>G e c.108G>A) apresentaram alterações na energia termodinâmica de dobramento ou na estrutura do mRNA. Também identificamos que c.1395A>C e c.3756A>T, ambas em BRCA2, podem resultar em alterações no splicing. Este foi o primeiro estudo avaliando a acurácia de ferramentas in silico para VS identificadas em um grupo abrangente de genes de predisposição ao câncer. Estudos funcionais complementares são necessários para a confirmação do potencial patogênico destas alterações moleculares. |
id |
URGS_baca9a0fbd2193e0fcda62a4b5199657 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/199014 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Scheid, Marina RobertaProlla, Patrícia Ashton2019-09-10T03:38:17Z2018http://hdl.handle.net/10183/199014001092309Com a introdução do sequenciamento em massa nos testes de diagnóstico através de painéis para genes de predisposição ao câncer (GPC) houve um aumento significativo no número de variantes detectadas. Uma grande parcela destas variantes são variantes sinônimas (VS), e a maioria inferem-se serem benignas, sem passar por uma avaliação de patogenicidade. Contudo, estima-se que um menor percentual de VS é capaz de alterar a expressão gênica se estiverem inseridas em regiões conservadas, como sítios de splicing, ílhas CpG, ou ainda interferir na conformação secundária do RNA mensageiro (mRNA). Nesse trabalho, foi avaliada a acurácia de ferramentas in silico gratuitas que analisam VS. Ademais, foram avaliadas VS obtidas do banco de dados público (ExAC) e de indivíduos avaliados para genes associados a câncer hereditário. As ferramentas in silico selecionadas para as análises foram divididas em três grupos: ferramentas para análise de conservação (PhasCons e PhiloP), ferramentas de múltiplas anotações (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA e o software Silent Variant Analizer (SilVA)), e ferramentas para análise de splicing (SSF, NNSplice, MaxEntScan e GeneSplicer). Para os testes de sensibilidade e especificidade foi realizada uma curva-ROC (Receiver Operating Characteristic Curve) para cada ferramenta utilizando o software SPSS. Variantes depositadas no ClinVar e sabidamente patogênicas foram utilizadas como padrão-ouro. Foram selecionadas VS de dois grupos: o primeiro composto por variantes depositadas no banco de dados ExAC, enquanto que o segundo, era composto por variantes identificadas em indivíduos com critérios clínicos para câncer hereditário e que realizaram sequenciamento completo de TP53, BRCA1 e BRCA2 no Hospital de Clínicas de Porto Alegre. Todas as VS foram avaliadas pelos preditores que obtiveram melhores valores de sensibilidade-especificidade. A análise de estrutura secundária (ES) e diferença da energia de dobramento (ΔMEF) do mRNA foi realizada através do RNAfold e a presença de ilhas CpG pelo programa MethPrimer. Como resultados, o software SilVA apresentou a maior acurácia entre todas as ferramentas de múltiplas anotações avaliadas, e apenas o preditor GWAVA não apresentou valores significativos de área abaixo da curva (AAC) para as VS avaliadas. Todos as ferramentas de conservação e splicing apresentaram valores significativos AAC. Do total de 4.324 VS selecionadas a partir do ExAC, aproximadamente 1% destas foram preditas como provavelmente ou possivelmente patogênicas pelo software SilVA. Análises adicionais demonstraram que alteração no splicing deve ser o principal 6 mecanismo de patogenicidade presente nesse grupo. Em relação as VS identificadas no segundo grupo de estudo, foram selecionadas VS cuja frequência populacional era inferior a 0,05. Quatorze variantes sinônimas em TP53 (n=3), BRCA1 (n=2) e BRCA2 (n=9) foram selecionadas para a análise por ferramentas in silico. As análises estruturais de dobramento do mRNA demonstraram que duas VS identificadas em TP53 (c.66A>G e c.108G>A) apresentaram alterações na energia termodinâmica de dobramento ou na estrutura do mRNA. Também identificamos que c.1395A>C e c.3756A>T, ambas em BRCA2, podem resultar em alterações no splicing. Este foi o primeiro estudo avaliando a acurácia de ferramentas in silico para VS identificadas em um grupo abrangente de genes de predisposição ao câncer. Estudos funcionais complementares são necessários para a confirmação do potencial patogênico destas alterações moleculares.After the introduction of the massive parallel sequencing for genetic diagnostic tests through gene panels for hereditary cancer predisposing genes there was a significant increasing in the number of detected variants. A great proportion of these variants are synonymous variants (SVs), and most of them are inferred to be benign, without undergoing pathogenicity assessment. However, it is estimated that a small but significant percentage of SVs are capable of altering gene expression whether they are inserted in conserved regions, such as splicing sites, CpG islands, or altering the secondary mRNA conformation. In this work, we evaluated the accuracy of free-access in silico tools that analyze SVs. We also evaluated SVs obtained from a public database (ExAC) and from genetic testing results from a cancer risk assessment clinic. In silico tools selected for the analysis belong to three groups: tools to evaluate nucleotide conservation (PhasCons and PhyloP), multiple annotation (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA and SilVA), and splicing (SSF, NNSplice, MaxEntScan and GeneSplicer). The Receiver Opearting Characteristic (ROC) curve was carried out for sensibility and specificity analysis of each tool using SPSS software. Analysis of secondary structure and difference of mRNA energy folding (ΔMEF) were performed by RNAfold and the presence of CpG island by MethPrimer. The software SilVA presented the highest accuracy between all multiple annotation in silico selected tools, and only GWAVA did not show significant values of area under the curve (AUC). All conservation and splicing tools selected presented significant values of AUC. Of the 4,324 SVs selected from ExAC, SilVA classified approximately 1% as likely or potentially pathogenic. Analysis by other in silico predictors demonstrated that splicing alterations could be the main mechanism involved in the pathogenicity mechanism of this group of variants. Regarding variants identified in the second group, SVs were filtered by global minor allelic frequency lower than 0.05 and fourteen SVs were selected in TP53 (n=3), BRCA1 (n=2) and BRCA2 (n=9). Structural analyses demonstrated that two SVs in the TP53 gene (c.66A>G and c.108G>A) were predicted to change the folding energy or structure of the mRNA. We also found that c.1395A>C and c.3756A>T, both in the BRCA2 gene, could result in splicing disruption according to in silico splicing tools. This was the first study to evaluate the accuracy of in silico tools for SVs in a comprehensive set of cancer predisposing genes. However, further analysis are still required to confirm the pathogenic potential of SVs.application/pdfporNeoplasiasPredisposição genética para doençaAnálise de sequênciaMutaçãoBiologia computacionalRNA mensageiroSynonymous variantsBRCA1 and BRCA2TP53Hereditary breast and ovarian cancerLi-Fraumeni SyndromeHereditary cancer predisposing syndromesSilent mutation, hereditary cancerSynonymous mutationAnálise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncerinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulFaculdade de MedicinaPrograma de Pós-Graduação em Medicina: Ciências MédicasPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001092309.pdf.txt001092309.pdf.txtExtracted Texttext/plain103330http://www.lume.ufrgs.br/bitstream/10183/199014/2/001092309.pdf.txt0aad490c0fd82d57305a6a4a9c9cecb2MD52ORIGINAL001092309.pdfTexto completoapplication/pdf1495319http://www.lume.ufrgs.br/bitstream/10183/199014/1/001092309.pdfc5810c400373598c5fb2305ce5d60efdMD5110183/1990142022-09-01 05:00:40.14239oai:www.lume.ufrgs.br:10183/199014Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-09-01T08:00:40Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer |
title |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer |
spellingShingle |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer Scheid, Marina Roberta Neoplasias Predisposição genética para doença Análise de sequência Mutação Biologia computacional RNA mensageiro Synonymous variants BRCA1 and BRCA2 TP53 Hereditary breast and ovarian cancer Li-Fraumeni Syndrome Hereditary cancer predisposing syndromes Silent mutation, hereditary cancer Synonymous mutation |
title_short |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer |
title_full |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer |
title_fullStr |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer |
title_full_unstemmed |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer |
title_sort |
Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer |
author |
Scheid, Marina Roberta |
author_facet |
Scheid, Marina Roberta |
author_role |
author |
dc.contributor.author.fl_str_mv |
Scheid, Marina Roberta |
dc.contributor.advisor1.fl_str_mv |
Prolla, Patrícia Ashton |
contributor_str_mv |
Prolla, Patrícia Ashton |
dc.subject.por.fl_str_mv |
Neoplasias Predisposição genética para doença Análise de sequência Mutação Biologia computacional RNA mensageiro |
topic |
Neoplasias Predisposição genética para doença Análise de sequência Mutação Biologia computacional RNA mensageiro Synonymous variants BRCA1 and BRCA2 TP53 Hereditary breast and ovarian cancer Li-Fraumeni Syndrome Hereditary cancer predisposing syndromes Silent mutation, hereditary cancer Synonymous mutation |
dc.subject.eng.fl_str_mv |
Synonymous variants BRCA1 and BRCA2 TP53 Hereditary breast and ovarian cancer Li-Fraumeni Syndrome Hereditary cancer predisposing syndromes Silent mutation, hereditary cancer Synonymous mutation |
description |
Com a introdução do sequenciamento em massa nos testes de diagnóstico através de painéis para genes de predisposição ao câncer (GPC) houve um aumento significativo no número de variantes detectadas. Uma grande parcela destas variantes são variantes sinônimas (VS), e a maioria inferem-se serem benignas, sem passar por uma avaliação de patogenicidade. Contudo, estima-se que um menor percentual de VS é capaz de alterar a expressão gênica se estiverem inseridas em regiões conservadas, como sítios de splicing, ílhas CpG, ou ainda interferir na conformação secundária do RNA mensageiro (mRNA). Nesse trabalho, foi avaliada a acurácia de ferramentas in silico gratuitas que analisam VS. Ademais, foram avaliadas VS obtidas do banco de dados público (ExAC) e de indivíduos avaliados para genes associados a câncer hereditário. As ferramentas in silico selecionadas para as análises foram divididas em três grupos: ferramentas para análise de conservação (PhasCons e PhiloP), ferramentas de múltiplas anotações (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA e o software Silent Variant Analizer (SilVA)), e ferramentas para análise de splicing (SSF, NNSplice, MaxEntScan e GeneSplicer). Para os testes de sensibilidade e especificidade foi realizada uma curva-ROC (Receiver Operating Characteristic Curve) para cada ferramenta utilizando o software SPSS. Variantes depositadas no ClinVar e sabidamente patogênicas foram utilizadas como padrão-ouro. Foram selecionadas VS de dois grupos: o primeiro composto por variantes depositadas no banco de dados ExAC, enquanto que o segundo, era composto por variantes identificadas em indivíduos com critérios clínicos para câncer hereditário e que realizaram sequenciamento completo de TP53, BRCA1 e BRCA2 no Hospital de Clínicas de Porto Alegre. Todas as VS foram avaliadas pelos preditores que obtiveram melhores valores de sensibilidade-especificidade. A análise de estrutura secundária (ES) e diferença da energia de dobramento (ΔMEF) do mRNA foi realizada através do RNAfold e a presença de ilhas CpG pelo programa MethPrimer. Como resultados, o software SilVA apresentou a maior acurácia entre todas as ferramentas de múltiplas anotações avaliadas, e apenas o preditor GWAVA não apresentou valores significativos de área abaixo da curva (AAC) para as VS avaliadas. Todos as ferramentas de conservação e splicing apresentaram valores significativos AAC. Do total de 4.324 VS selecionadas a partir do ExAC, aproximadamente 1% destas foram preditas como provavelmente ou possivelmente patogênicas pelo software SilVA. Análises adicionais demonstraram que alteração no splicing deve ser o principal 6 mecanismo de patogenicidade presente nesse grupo. Em relação as VS identificadas no segundo grupo de estudo, foram selecionadas VS cuja frequência populacional era inferior a 0,05. Quatorze variantes sinônimas em TP53 (n=3), BRCA1 (n=2) e BRCA2 (n=9) foram selecionadas para a análise por ferramentas in silico. As análises estruturais de dobramento do mRNA demonstraram que duas VS identificadas em TP53 (c.66A>G e c.108G>A) apresentaram alterações na energia termodinâmica de dobramento ou na estrutura do mRNA. Também identificamos que c.1395A>C e c.3756A>T, ambas em BRCA2, podem resultar em alterações no splicing. Este foi o primeiro estudo avaliando a acurácia de ferramentas in silico para VS identificadas em um grupo abrangente de genes de predisposição ao câncer. Estudos funcionais complementares são necessários para a confirmação do potencial patogênico destas alterações moleculares. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018 |
dc.date.accessioned.fl_str_mv |
2019-09-10T03:38:17Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/199014 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001092309 |
url |
http://hdl.handle.net/10183/199014 |
identifier_str_mv |
001092309 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/199014/2/001092309.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/199014/1/001092309.pdf |
bitstream.checksum.fl_str_mv |
0aad490c0fd82d57305a6a4a9c9cecb2 c5810c400373598c5fb2305ce5d60efd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1810085497285902336 |