Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer

Detalhes bibliográficos
Autor(a) principal: Scheid, Marina Roberta
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/199014
Resumo: Com a introdução do sequenciamento em massa nos testes de diagnóstico através de painéis para genes de predisposição ao câncer (GPC) houve um aumento significativo no número de variantes detectadas. Uma grande parcela destas variantes são variantes sinônimas (VS), e a maioria inferem-se serem benignas, sem passar por uma avaliação de patogenicidade. Contudo, estima-se que um menor percentual de VS é capaz de alterar a expressão gênica se estiverem inseridas em regiões conservadas, como sítios de splicing, ílhas CpG, ou ainda interferir na conformação secundária do RNA mensageiro (mRNA). Nesse trabalho, foi avaliada a acurácia de ferramentas in silico gratuitas que analisam VS. Ademais, foram avaliadas VS obtidas do banco de dados público (ExAC) e de indivíduos avaliados para genes associados a câncer hereditário. As ferramentas in silico selecionadas para as análises foram divididas em três grupos: ferramentas para análise de conservação (PhasCons e PhiloP), ferramentas de múltiplas anotações (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA e o software Silent Variant Analizer (SilVA)), e ferramentas para análise de splicing (SSF, NNSplice, MaxEntScan e GeneSplicer). Para os testes de sensibilidade e especificidade foi realizada uma curva-ROC (Receiver Operating Characteristic Curve) para cada ferramenta utilizando o software SPSS. Variantes depositadas no ClinVar e sabidamente patogênicas foram utilizadas como padrão-ouro. Foram selecionadas VS de dois grupos: o primeiro composto por variantes depositadas no banco de dados ExAC, enquanto que o segundo, era composto por variantes identificadas em indivíduos com critérios clínicos para câncer hereditário e que realizaram sequenciamento completo de TP53, BRCA1 e BRCA2 no Hospital de Clínicas de Porto Alegre. Todas as VS foram avaliadas pelos preditores que obtiveram melhores valores de sensibilidade-especificidade. A análise de estrutura secundária (ES) e diferença da energia de dobramento (ΔMEF) do mRNA foi realizada através do RNAfold e a presença de ilhas CpG pelo programa MethPrimer. Como resultados, o software SilVA apresentou a maior acurácia entre todas as ferramentas de múltiplas anotações avaliadas, e apenas o preditor GWAVA não apresentou valores significativos de área abaixo da curva (AAC) para as VS avaliadas. Todos as ferramentas de conservação e splicing apresentaram valores significativos AAC. Do total de 4.324 VS selecionadas a partir do ExAC, aproximadamente 1% destas foram preditas como provavelmente ou possivelmente patogênicas pelo software SilVA. Análises adicionais demonstraram que alteração no splicing deve ser o principal 6 mecanismo de patogenicidade presente nesse grupo. Em relação as VS identificadas no segundo grupo de estudo, foram selecionadas VS cuja frequência populacional era inferior a 0,05. Quatorze variantes sinônimas em TP53 (n=3), BRCA1 (n=2) e BRCA2 (n=9) foram selecionadas para a análise por ferramentas in silico. As análises estruturais de dobramento do mRNA demonstraram que duas VS identificadas em TP53 (c.66A>G e c.108G>A) apresentaram alterações na energia termodinâmica de dobramento ou na estrutura do mRNA. Também identificamos que c.1395A>C e c.3756A>T, ambas em BRCA2, podem resultar em alterações no splicing. Este foi o primeiro estudo avaliando a acurácia de ferramentas in silico para VS identificadas em um grupo abrangente de genes de predisposição ao câncer. Estudos funcionais complementares são necessários para a confirmação do potencial patogênico destas alterações moleculares.
id URGS_baca9a0fbd2193e0fcda62a4b5199657
oai_identifier_str oai:www.lume.ufrgs.br:10183/199014
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Scheid, Marina RobertaProlla, Patrícia Ashton2019-09-10T03:38:17Z2018http://hdl.handle.net/10183/199014001092309Com a introdução do sequenciamento em massa nos testes de diagnóstico através de painéis para genes de predisposição ao câncer (GPC) houve um aumento significativo no número de variantes detectadas. Uma grande parcela destas variantes são variantes sinônimas (VS), e a maioria inferem-se serem benignas, sem passar por uma avaliação de patogenicidade. Contudo, estima-se que um menor percentual de VS é capaz de alterar a expressão gênica se estiverem inseridas em regiões conservadas, como sítios de splicing, ílhas CpG, ou ainda interferir na conformação secundária do RNA mensageiro (mRNA). Nesse trabalho, foi avaliada a acurácia de ferramentas in silico gratuitas que analisam VS. Ademais, foram avaliadas VS obtidas do banco de dados público (ExAC) e de indivíduos avaliados para genes associados a câncer hereditário. As ferramentas in silico selecionadas para as análises foram divididas em três grupos: ferramentas para análise de conservação (PhasCons e PhiloP), ferramentas de múltiplas anotações (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA e o software Silent Variant Analizer (SilVA)), e ferramentas para análise de splicing (SSF, NNSplice, MaxEntScan e GeneSplicer). Para os testes de sensibilidade e especificidade foi realizada uma curva-ROC (Receiver Operating Characteristic Curve) para cada ferramenta utilizando o software SPSS. Variantes depositadas no ClinVar e sabidamente patogênicas foram utilizadas como padrão-ouro. Foram selecionadas VS de dois grupos: o primeiro composto por variantes depositadas no banco de dados ExAC, enquanto que o segundo, era composto por variantes identificadas em indivíduos com critérios clínicos para câncer hereditário e que realizaram sequenciamento completo de TP53, BRCA1 e BRCA2 no Hospital de Clínicas de Porto Alegre. Todas as VS foram avaliadas pelos preditores que obtiveram melhores valores de sensibilidade-especificidade. A análise de estrutura secundária (ES) e diferença da energia de dobramento (ΔMEF) do mRNA foi realizada através do RNAfold e a presença de ilhas CpG pelo programa MethPrimer. Como resultados, o software SilVA apresentou a maior acurácia entre todas as ferramentas de múltiplas anotações avaliadas, e apenas o preditor GWAVA não apresentou valores significativos de área abaixo da curva (AAC) para as VS avaliadas. Todos as ferramentas de conservação e splicing apresentaram valores significativos AAC. Do total de 4.324 VS selecionadas a partir do ExAC, aproximadamente 1% destas foram preditas como provavelmente ou possivelmente patogênicas pelo software SilVA. Análises adicionais demonstraram que alteração no splicing deve ser o principal 6 mecanismo de patogenicidade presente nesse grupo. Em relação as VS identificadas no segundo grupo de estudo, foram selecionadas VS cuja frequência populacional era inferior a 0,05. Quatorze variantes sinônimas em TP53 (n=3), BRCA1 (n=2) e BRCA2 (n=9) foram selecionadas para a análise por ferramentas in silico. As análises estruturais de dobramento do mRNA demonstraram que duas VS identificadas em TP53 (c.66A>G e c.108G>A) apresentaram alterações na energia termodinâmica de dobramento ou na estrutura do mRNA. Também identificamos que c.1395A>C e c.3756A>T, ambas em BRCA2, podem resultar em alterações no splicing. Este foi o primeiro estudo avaliando a acurácia de ferramentas in silico para VS identificadas em um grupo abrangente de genes de predisposição ao câncer. Estudos funcionais complementares são necessários para a confirmação do potencial patogênico destas alterações moleculares.After the introduction of the massive parallel sequencing for genetic diagnostic tests through gene panels for hereditary cancer predisposing genes there was a significant increasing in the number of detected variants. A great proportion of these variants are synonymous variants (SVs), and most of them are inferred to be benign, without undergoing pathogenicity assessment. However, it is estimated that a small but significant percentage of SVs are capable of altering gene expression whether they are inserted in conserved regions, such as splicing sites, CpG islands, or altering the secondary mRNA conformation. In this work, we evaluated the accuracy of free-access in silico tools that analyze SVs. We also evaluated SVs obtained from a public database (ExAC) and from genetic testing results from a cancer risk assessment clinic. In silico tools selected for the analysis belong to three groups: tools to evaluate nucleotide conservation (PhasCons and PhyloP), multiple annotation (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA and SilVA), and splicing (SSF, NNSplice, MaxEntScan and GeneSplicer). The Receiver Opearting Characteristic (ROC) curve was carried out for sensibility and specificity analysis of each tool using SPSS software. Analysis of secondary structure and difference of mRNA energy folding (ΔMEF) were performed by RNAfold and the presence of CpG island by MethPrimer. The software SilVA presented the highest accuracy between all multiple annotation in silico selected tools, and only GWAVA did not show significant values of area under the curve (AUC). All conservation and splicing tools selected presented significant values of AUC. Of the 4,324 SVs selected from ExAC, SilVA classified approximately 1% as likely or potentially pathogenic. Analysis by other in silico predictors demonstrated that splicing alterations could be the main mechanism involved in the pathogenicity mechanism of this group of variants. Regarding variants identified in the second group, SVs were filtered by global minor allelic frequency lower than 0.05 and fourteen SVs were selected in TP53 (n=3), BRCA1 (n=2) and BRCA2 (n=9). Structural analyses demonstrated that two SVs in the TP53 gene (c.66A>G and c.108G>A) were predicted to change the folding energy or structure of the mRNA. We also found that c.1395A>C and c.3756A>T, both in the BRCA2 gene, could result in splicing disruption according to in silico splicing tools. This was the first study to evaluate the accuracy of in silico tools for SVs in a comprehensive set of cancer predisposing genes. However, further analysis are still required to confirm the pathogenic potential of SVs.application/pdfporNeoplasiasPredisposição genética para doençaAnálise de sequênciaMutaçãoBiologia computacionalRNA mensageiroSynonymous variantsBRCA1 and BRCA2TP53Hereditary breast and ovarian cancerLi-Fraumeni SyndromeHereditary cancer predisposing syndromesSilent mutation, hereditary cancerSynonymous mutationAnálise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncerinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulFaculdade de MedicinaPrograma de Pós-Graduação em Medicina: Ciências MédicasPorto Alegre, BR-RS2018mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001092309.pdf.txt001092309.pdf.txtExtracted Texttext/plain103330http://www.lume.ufrgs.br/bitstream/10183/199014/2/001092309.pdf.txt0aad490c0fd82d57305a6a4a9c9cecb2MD52ORIGINAL001092309.pdfTexto completoapplication/pdf1495319http://www.lume.ufrgs.br/bitstream/10183/199014/1/001092309.pdfc5810c400373598c5fb2305ce5d60efdMD5110183/1990142022-09-01 05:00:40.14239oai:www.lume.ufrgs.br:10183/199014Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-09-01T08:00:40Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
title Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
spellingShingle Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
Scheid, Marina Roberta
Neoplasias
Predisposição genética para doença
Análise de sequência
Mutação
Biologia computacional
RNA mensageiro
Synonymous variants
BRCA1 and BRCA2
TP53
Hereditary breast and ovarian cancer
Li-Fraumeni Syndrome
Hereditary cancer predisposing syndromes
Silent mutation, hereditary cancer
Synonymous mutation
title_short Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
title_full Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
title_fullStr Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
title_full_unstemmed Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
title_sort Análise de ferramentas in silico para variantes sinônimas em genes de predisposição ao câncer
author Scheid, Marina Roberta
author_facet Scheid, Marina Roberta
author_role author
dc.contributor.author.fl_str_mv Scheid, Marina Roberta
dc.contributor.advisor1.fl_str_mv Prolla, Patrícia Ashton
contributor_str_mv Prolla, Patrícia Ashton
dc.subject.por.fl_str_mv Neoplasias
Predisposição genética para doença
Análise de sequência
Mutação
Biologia computacional
RNA mensageiro
topic Neoplasias
Predisposição genética para doença
Análise de sequência
Mutação
Biologia computacional
RNA mensageiro
Synonymous variants
BRCA1 and BRCA2
TP53
Hereditary breast and ovarian cancer
Li-Fraumeni Syndrome
Hereditary cancer predisposing syndromes
Silent mutation, hereditary cancer
Synonymous mutation
dc.subject.eng.fl_str_mv Synonymous variants
BRCA1 and BRCA2
TP53
Hereditary breast and ovarian cancer
Li-Fraumeni Syndrome
Hereditary cancer predisposing syndromes
Silent mutation, hereditary cancer
Synonymous mutation
description Com a introdução do sequenciamento em massa nos testes de diagnóstico através de painéis para genes de predisposição ao câncer (GPC) houve um aumento significativo no número de variantes detectadas. Uma grande parcela destas variantes são variantes sinônimas (VS), e a maioria inferem-se serem benignas, sem passar por uma avaliação de patogenicidade. Contudo, estima-se que um menor percentual de VS é capaz de alterar a expressão gênica se estiverem inseridas em regiões conservadas, como sítios de splicing, ílhas CpG, ou ainda interferir na conformação secundária do RNA mensageiro (mRNA). Nesse trabalho, foi avaliada a acurácia de ferramentas in silico gratuitas que analisam VS. Ademais, foram avaliadas VS obtidas do banco de dados público (ExAC) e de indivíduos avaliados para genes associados a câncer hereditário. As ferramentas in silico selecionadas para as análises foram divididas em três grupos: ferramentas para análise de conservação (PhasCons e PhiloP), ferramentas de múltiplas anotações (PredictSNP, CADD, DANN, FATHAMM, FUNSEQ2, GWAVA e o software Silent Variant Analizer (SilVA)), e ferramentas para análise de splicing (SSF, NNSplice, MaxEntScan e GeneSplicer). Para os testes de sensibilidade e especificidade foi realizada uma curva-ROC (Receiver Operating Characteristic Curve) para cada ferramenta utilizando o software SPSS. Variantes depositadas no ClinVar e sabidamente patogênicas foram utilizadas como padrão-ouro. Foram selecionadas VS de dois grupos: o primeiro composto por variantes depositadas no banco de dados ExAC, enquanto que o segundo, era composto por variantes identificadas em indivíduos com critérios clínicos para câncer hereditário e que realizaram sequenciamento completo de TP53, BRCA1 e BRCA2 no Hospital de Clínicas de Porto Alegre. Todas as VS foram avaliadas pelos preditores que obtiveram melhores valores de sensibilidade-especificidade. A análise de estrutura secundária (ES) e diferença da energia de dobramento (ΔMEF) do mRNA foi realizada através do RNAfold e a presença de ilhas CpG pelo programa MethPrimer. Como resultados, o software SilVA apresentou a maior acurácia entre todas as ferramentas de múltiplas anotações avaliadas, e apenas o preditor GWAVA não apresentou valores significativos de área abaixo da curva (AAC) para as VS avaliadas. Todos as ferramentas de conservação e splicing apresentaram valores significativos AAC. Do total de 4.324 VS selecionadas a partir do ExAC, aproximadamente 1% destas foram preditas como provavelmente ou possivelmente patogênicas pelo software SilVA. Análises adicionais demonstraram que alteração no splicing deve ser o principal 6 mecanismo de patogenicidade presente nesse grupo. Em relação as VS identificadas no segundo grupo de estudo, foram selecionadas VS cuja frequência populacional era inferior a 0,05. Quatorze variantes sinônimas em TP53 (n=3), BRCA1 (n=2) e BRCA2 (n=9) foram selecionadas para a análise por ferramentas in silico. As análises estruturais de dobramento do mRNA demonstraram que duas VS identificadas em TP53 (c.66A>G e c.108G>A) apresentaram alterações na energia termodinâmica de dobramento ou na estrutura do mRNA. Também identificamos que c.1395A>C e c.3756A>T, ambas em BRCA2, podem resultar em alterações no splicing. Este foi o primeiro estudo avaliando a acurácia de ferramentas in silico para VS identificadas em um grupo abrangente de genes de predisposição ao câncer. Estudos funcionais complementares são necessários para a confirmação do potencial patogênico destas alterações moleculares.
publishDate 2018
dc.date.issued.fl_str_mv 2018
dc.date.accessioned.fl_str_mv 2019-09-10T03:38:17Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/199014
dc.identifier.nrb.pt_BR.fl_str_mv 001092309
url http://hdl.handle.net/10183/199014
identifier_str_mv 001092309
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/199014/2/001092309.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/199014/1/001092309.pdf
bitstream.checksum.fl_str_mv 0aad490c0fd82d57305a6a4a9c9cecb2
c5810c400373598c5fb2305ce5d60efd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1810085497285902336