Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/50991 |
Resumo: | A abordagem proteômica permite estudos em larga escala da expressão proteica em diferentes tecidos e fluidos corporais, tendo como objetivo identificar e quantificar o conteúdo proteico total. No processo de análise proteômica, a identificação de proteínas ainda apresenta lacunas, apesar dos grandes avanços na área. Frequentemente, um espectrômetro de massa é utilizado para gerar valores de massa/carga das amostras. Após esse processo, geralmente utiliza-se um banco de dados de proteínas referência (por exemplo, UniProt) para identificação das proteínas. Porém, utilizar uma base de referência limita as análises de identificação das proteínas, uma vez que não contém as variações que ocorrem no DNA, que podem impactar na sequência de aminoácidos, ocasionando identificação incorreta ou impossibilitando o processo. Nesse contexto, existem diversas bases de dados personalizadas que incorporam tais variações genéticas. Embora apresentem bons resultados, também se limitam devido à ausência de algumas mutações, tornando-se outro problema no processo de identificação. Portanto, essa pesquisa tem como objetivo construir m banco de dados de proteogenômica (dbPepVar) combinando informações de variação genética do dbSNP com sequências de proteínas do RefSeq do NCBI. Conjuntos de dados públicos de espectrometria de massa foram usados para realizar uma análise pan-câncer (Ovário, Colorretal, Mama e Próstata), permitindo a identificação de variações genéticas únicas. No total, 3.726 peptídeos variantes foram identificados em amostras de câncer de ovário, 2.543 em próstata, 2.661 em mama e 2.411 em câncer de cólon-retal. Uma análise de frequência mutacional mostrou genes envolvidos nos processos de progressão tumoral, sensibilidade à quimioterapia e risco de suscetibilidade ao câncer. Curiosamente, em muitas amostras, foram identificados peptídeos C-terminais de proteínas encurtadas originárias de eventos de códon de terminação prematura (PTC). Isso indica que tais proteínas escaparam do decaimento mediado por mutações Nonsense (NMD) e, não surpreendentemente, os genes da maquinaria NMD também estão mutados nas mesmas amostras. Isso sugere que o vestígio do transcrito truncado pode estar associado à ineficiência da maquinaria NMD causada por mutações genéticas. Em perspectiva, o portal web desenvolvido bem como as análises realizadas podem direcionar estudos para identificar novos alvos terapêuticos para diferentes tipos de câncer, podendo-se também utilizar nosso banco de dados para caracterização de variantes em amostras de antecedentes genéticos desconhecidos, como amostras arquivadas. O portal está disponível em: https://bioinfo.imd.ufrn.br/dbPepVar/. |
id |
UFRN_168723a315b9ae24dd84935ce6317de7 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/50991 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Cunha, Lucas Marques dahttps://orcid.org/0000-0003-1555-2505http://lattes.cnpq.br/6545545471833974http://lattes.cnpq.br/1012629455821774Medeiros, Silvia Regina Batistuzzo dehttps://orcid.org/0000-0003-2431-0479http://lattes.cnpq.br/5882662534904226Passetti, FábioUchoa, Adriana FerreiraLanza, Daniel Carlos FerreiraCarvalho, Paulo CostaSouza, Gustavo Antônio de2023-01-19T18:51:25Z2023-01-19T18:51:25Z2022-11-29CUNHA, Lucas Marques da. Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos. Orientador: Gustavo Antônio de Souza. 2022. 89f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/50991A abordagem proteômica permite estudos em larga escala da expressão proteica em diferentes tecidos e fluidos corporais, tendo como objetivo identificar e quantificar o conteúdo proteico total. No processo de análise proteômica, a identificação de proteínas ainda apresenta lacunas, apesar dos grandes avanços na área. Frequentemente, um espectrômetro de massa é utilizado para gerar valores de massa/carga das amostras. Após esse processo, geralmente utiliza-se um banco de dados de proteínas referência (por exemplo, UniProt) para identificação das proteínas. Porém, utilizar uma base de referência limita as análises de identificação das proteínas, uma vez que não contém as variações que ocorrem no DNA, que podem impactar na sequência de aminoácidos, ocasionando identificação incorreta ou impossibilitando o processo. Nesse contexto, existem diversas bases de dados personalizadas que incorporam tais variações genéticas. Embora apresentem bons resultados, também se limitam devido à ausência de algumas mutações, tornando-se outro problema no processo de identificação. Portanto, essa pesquisa tem como objetivo construir m banco de dados de proteogenômica (dbPepVar) combinando informações de variação genética do dbSNP com sequências de proteínas do RefSeq do NCBI. Conjuntos de dados públicos de espectrometria de massa foram usados para realizar uma análise pan-câncer (Ovário, Colorretal, Mama e Próstata), permitindo a identificação de variações genéticas únicas. No total, 3.726 peptídeos variantes foram identificados em amostras de câncer de ovário, 2.543 em próstata, 2.661 em mama e 2.411 em câncer de cólon-retal. Uma análise de frequência mutacional mostrou genes envolvidos nos processos de progressão tumoral, sensibilidade à quimioterapia e risco de suscetibilidade ao câncer. Curiosamente, em muitas amostras, foram identificados peptídeos C-terminais de proteínas encurtadas originárias de eventos de códon de terminação prematura (PTC). Isso indica que tais proteínas escaparam do decaimento mediado por mutações Nonsense (NMD) e, não surpreendentemente, os genes da maquinaria NMD também estão mutados nas mesmas amostras. Isso sugere que o vestígio do transcrito truncado pode estar associado à ineficiência da maquinaria NMD causada por mutações genéticas. Em perspectiva, o portal web desenvolvido bem como as análises realizadas podem direcionar estudos para identificar novos alvos terapêuticos para diferentes tipos de câncer, podendo-se também utilizar nosso banco de dados para caracterização de variantes em amostras de antecedentes genéticos desconhecidos, como amostras arquivadas. O portal está disponível em: https://bioinfo.imd.ufrn.br/dbPepVar/.The proteomic approach allows large-scale studies of protein expression in different tissues and body fluids, aiming to identify and quantify the total protein content. In the proteomic analysis process, protein identification still presents limitations despite major advances in the area. Frequently, a mass spectrometer is used to generate mass/charge values of the samples. After this process, a reference protein database (eg, UniProt) is usually used to identify proteins. However, using a reference database limits the analysis of the identification of the proteins, since it does not contain the variations in the DNA that can impact the sequence of amino acids, causing incorrect identification or making the process impossible. In this context, there are several custom databases that incorporate such genetic variations. Although they present good results, they are also limited due to the absence of some mutations, becoming another problem in the identification process. Therefore, this research aims to build a proteogenomic database (dbPepVar) by combining genetic variation information from dbSNP with protein sequences from the NCBI RefSeq. Public mass spectrometry datasets were used to perform a pan-cancer analysis (Ovarian, Colorectal, Breast, and Prostate), allowing the identification of unique genetic variations. In total 3,726 variant peptides were identified in ovarian cancer samples, 2,543 in prostate, 2,661 in breast and 2,411 in colon-rectal cancer. A mutational frequency analysis showed genes involved in tumor progression processes, sensitivity to chemotherapy, and risk of susceptibility to cancer. Interestingly, in many samples, C-terminal peptides from shortened proteins originating from premature termination codon (PTC) events were identified. This indicates that such proteins had escaped Nonsense-mediated decay (NMD) and, not surprisingly, NMD machinery genes are also mutated in the same samples. This suggests that the vestige of the truncated transcript may be associated with NMD machinery inefficiency caused by gene mutations. In perspective, the web portal developed as well as the analysis performed may direct studies to identify new therapeutic targets for different cancer, and one can also use our database for characterization of variants in samples of unknown genetic background, such as archived samples. The portal is available in: https://bioinfo.imd.ufrn.br/dbPepVar/.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICAUFRNBrasilCNPQ::CIENCIAS BIOLOGICASPeptídeos variantes - abordagem computacionalProteogenômicaPolimorfismoProteômicaBanco de dados personalizadoDesenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficosDevelopment of computational approaches for analysis and identification of polymorphic peptidesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALDesenvolvimentoabordagemcomputacional_Cunha_2022.pdfapplication/pdf7833410https://repositorio.ufrn.br/bitstream/123456789/50991/1/Desenvolvimentoabordagemcomputacional_Cunha_2022.pdf542c5a0b71b14ddfb9ef7af0f3e2bed8MD51123456789/509912023-01-19 15:52:08.264oai:https://repositorio.ufrn.br:123456789/50991Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-01-19T18:52:08Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos |
dc.title.alternative.pt_BR.fl_str_mv |
Development of computational approaches for analysis and identification of polymorphic peptides |
title |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos |
spellingShingle |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos Cunha, Lucas Marques da CNPQ::CIENCIAS BIOLOGICAS Peptídeos variantes - abordagem computacional Proteogenômica Polimorfismo Proteômica Banco de dados personalizado |
title_short |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos |
title_full |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos |
title_fullStr |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos |
title_full_unstemmed |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos |
title_sort |
Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos |
author |
Cunha, Lucas Marques da |
author_facet |
Cunha, Lucas Marques da |
author_role |
author |
dc.contributor.authorID.pt_BR.fl_str_mv |
https://orcid.org/0000-0003-1555-2505 |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6545545471833974 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1012629455821774 |
dc.contributor.referees1.none.fl_str_mv |
Passetti, Fábio |
dc.contributor.referees2.none.fl_str_mv |
Uchoa, Adriana Ferreira |
dc.contributor.referees3.none.fl_str_mv |
Lanza, Daniel Carlos Ferreira |
dc.contributor.referees4.none.fl_str_mv |
Carvalho, Paulo Costa |
dc.contributor.author.fl_str_mv |
Cunha, Lucas Marques da |
dc.contributor.advisor-co1.fl_str_mv |
Medeiros, Silvia Regina Batistuzzo de |
dc.contributor.advisor-co1ID.fl_str_mv |
https://orcid.org/0000-0003-2431-0479 |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/5882662534904226 |
dc.contributor.advisor1.fl_str_mv |
Souza, Gustavo Antônio de |
contributor_str_mv |
Medeiros, Silvia Regina Batistuzzo de Souza, Gustavo Antônio de |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS BIOLOGICAS |
topic |
CNPQ::CIENCIAS BIOLOGICAS Peptídeos variantes - abordagem computacional Proteogenômica Polimorfismo Proteômica Banco de dados personalizado |
dc.subject.por.fl_str_mv |
Peptídeos variantes - abordagem computacional Proteogenômica Polimorfismo Proteômica Banco de dados personalizado |
description |
A abordagem proteômica permite estudos em larga escala da expressão proteica em diferentes tecidos e fluidos corporais, tendo como objetivo identificar e quantificar o conteúdo proteico total. No processo de análise proteômica, a identificação de proteínas ainda apresenta lacunas, apesar dos grandes avanços na área. Frequentemente, um espectrômetro de massa é utilizado para gerar valores de massa/carga das amostras. Após esse processo, geralmente utiliza-se um banco de dados de proteínas referência (por exemplo, UniProt) para identificação das proteínas. Porém, utilizar uma base de referência limita as análises de identificação das proteínas, uma vez que não contém as variações que ocorrem no DNA, que podem impactar na sequência de aminoácidos, ocasionando identificação incorreta ou impossibilitando o processo. Nesse contexto, existem diversas bases de dados personalizadas que incorporam tais variações genéticas. Embora apresentem bons resultados, também se limitam devido à ausência de algumas mutações, tornando-se outro problema no processo de identificação. Portanto, essa pesquisa tem como objetivo construir m banco de dados de proteogenômica (dbPepVar) combinando informações de variação genética do dbSNP com sequências de proteínas do RefSeq do NCBI. Conjuntos de dados públicos de espectrometria de massa foram usados para realizar uma análise pan-câncer (Ovário, Colorretal, Mama e Próstata), permitindo a identificação de variações genéticas únicas. No total, 3.726 peptídeos variantes foram identificados em amostras de câncer de ovário, 2.543 em próstata, 2.661 em mama e 2.411 em câncer de cólon-retal. Uma análise de frequência mutacional mostrou genes envolvidos nos processos de progressão tumoral, sensibilidade à quimioterapia e risco de suscetibilidade ao câncer. Curiosamente, em muitas amostras, foram identificados peptídeos C-terminais de proteínas encurtadas originárias de eventos de códon de terminação prematura (PTC). Isso indica que tais proteínas escaparam do decaimento mediado por mutações Nonsense (NMD) e, não surpreendentemente, os genes da maquinaria NMD também estão mutados nas mesmas amostras. Isso sugere que o vestígio do transcrito truncado pode estar associado à ineficiência da maquinaria NMD causada por mutações genéticas. Em perspectiva, o portal web desenvolvido bem como as análises realizadas podem direcionar estudos para identificar novos alvos terapêuticos para diferentes tipos de câncer, podendo-se também utilizar nosso banco de dados para caracterização de variantes em amostras de antecedentes genéticos desconhecidos, como amostras arquivadas. O portal está disponível em: https://bioinfo.imd.ufrn.br/dbPepVar/. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022-11-29 |
dc.date.accessioned.fl_str_mv |
2023-01-19T18:51:25Z |
dc.date.available.fl_str_mv |
2023-01-19T18:51:25Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CUNHA, Lucas Marques da. Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos. Orientador: Gustavo Antônio de Souza. 2022. 89f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/50991 |
identifier_str_mv |
CUNHA, Lucas Marques da. Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos. Orientador: Gustavo Antônio de Souza. 2022. 89f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
url |
https://repositorio.ufrn.br/handle/123456789/50991 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/50991/1/Desenvolvimentoabordagemcomputacional_Cunha_2022.pdf |
bitstream.checksum.fl_str_mv |
542c5a0b71b14ddfb9ef7af0f3e2bed8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1802117611422482432 |