Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos

Detalhes bibliográficos
Autor(a) principal: Cunha, Lucas Marques da
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/50991
Resumo: A abordagem proteômica permite estudos em larga escala da expressão proteica em diferentes tecidos e fluidos corporais, tendo como objetivo identificar e quantificar o conteúdo proteico total. No processo de análise proteômica, a identificação de proteínas ainda apresenta lacunas, apesar dos grandes avanços na área. Frequentemente, um espectrômetro de massa é utilizado para gerar valores de massa/carga das amostras. Após esse processo, geralmente utiliza-se um banco de dados de proteínas referência (por exemplo, UniProt) para identificação das proteínas. Porém, utilizar uma base de referência limita as análises de identificação das proteínas, uma vez que não contém as variações que ocorrem no DNA, que podem impactar na sequência de aminoácidos, ocasionando identificação incorreta ou impossibilitando o processo. Nesse contexto, existem diversas bases de dados personalizadas que incorporam tais variações genéticas. Embora apresentem bons resultados, também se limitam devido à ausência de algumas mutações, tornando-se outro problema no processo de identificação. Portanto, essa pesquisa tem como objetivo construir m banco de dados de proteogenômica (dbPepVar) combinando informações de variação genética do dbSNP com sequências de proteínas do RefSeq do NCBI. Conjuntos de dados públicos de espectrometria de massa foram usados para realizar uma análise pan-câncer (Ovário, Colorretal, Mama e Próstata), permitindo a identificação de variações genéticas únicas. No total, 3.726 peptídeos variantes foram identificados em amostras de câncer de ovário, 2.543 em próstata, 2.661 em mama e 2.411 em câncer de cólon-retal. Uma análise de frequência mutacional mostrou genes envolvidos nos processos de progressão tumoral, sensibilidade à quimioterapia e risco de suscetibilidade ao câncer. Curiosamente, em muitas amostras, foram identificados peptídeos C-terminais de proteínas encurtadas originárias de eventos de códon de terminação prematura (PTC). Isso indica que tais proteínas escaparam do decaimento mediado por mutações Nonsense (NMD) e, não surpreendentemente, os genes da maquinaria NMD também estão mutados nas mesmas amostras. Isso sugere que o vestígio do transcrito truncado pode estar associado à ineficiência da maquinaria NMD causada por mutações genéticas. Em perspectiva, o portal web desenvolvido bem como as análises realizadas podem direcionar estudos para identificar novos alvos terapêuticos para diferentes tipos de câncer, podendo-se também utilizar nosso banco de dados para caracterização de variantes em amostras de antecedentes genéticos desconhecidos, como amostras arquivadas. O portal está disponível em: https://bioinfo.imd.ufrn.br/dbPepVar/.
id UFRN_168723a315b9ae24dd84935ce6317de7
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/50991
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Cunha, Lucas Marques dahttps://orcid.org/0000-0003-1555-2505http://lattes.cnpq.br/6545545471833974http://lattes.cnpq.br/1012629455821774Medeiros, Silvia Regina Batistuzzo dehttps://orcid.org/0000-0003-2431-0479http://lattes.cnpq.br/5882662534904226Passetti, FábioUchoa, Adriana FerreiraLanza, Daniel Carlos FerreiraCarvalho, Paulo CostaSouza, Gustavo Antônio de2023-01-19T18:51:25Z2023-01-19T18:51:25Z2022-11-29CUNHA, Lucas Marques da. Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos. Orientador: Gustavo Antônio de Souza. 2022. 89f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/50991A abordagem proteômica permite estudos em larga escala da expressão proteica em diferentes tecidos e fluidos corporais, tendo como objetivo identificar e quantificar o conteúdo proteico total. No processo de análise proteômica, a identificação de proteínas ainda apresenta lacunas, apesar dos grandes avanços na área. Frequentemente, um espectrômetro de massa é utilizado para gerar valores de massa/carga das amostras. Após esse processo, geralmente utiliza-se um banco de dados de proteínas referência (por exemplo, UniProt) para identificação das proteínas. Porém, utilizar uma base de referência limita as análises de identificação das proteínas, uma vez que não contém as variações que ocorrem no DNA, que podem impactar na sequência de aminoácidos, ocasionando identificação incorreta ou impossibilitando o processo. Nesse contexto, existem diversas bases de dados personalizadas que incorporam tais variações genéticas. Embora apresentem bons resultados, também se limitam devido à ausência de algumas mutações, tornando-se outro problema no processo de identificação. Portanto, essa pesquisa tem como objetivo construir m banco de dados de proteogenômica (dbPepVar) combinando informações de variação genética do dbSNP com sequências de proteínas do RefSeq do NCBI. Conjuntos de dados públicos de espectrometria de massa foram usados para realizar uma análise pan-câncer (Ovário, Colorretal, Mama e Próstata), permitindo a identificação de variações genéticas únicas. No total, 3.726 peptídeos variantes foram identificados em amostras de câncer de ovário, 2.543 em próstata, 2.661 em mama e 2.411 em câncer de cólon-retal. Uma análise de frequência mutacional mostrou genes envolvidos nos processos de progressão tumoral, sensibilidade à quimioterapia e risco de suscetibilidade ao câncer. Curiosamente, em muitas amostras, foram identificados peptídeos C-terminais de proteínas encurtadas originárias de eventos de códon de terminação prematura (PTC). Isso indica que tais proteínas escaparam do decaimento mediado por mutações Nonsense (NMD) e, não surpreendentemente, os genes da maquinaria NMD também estão mutados nas mesmas amostras. Isso sugere que o vestígio do transcrito truncado pode estar associado à ineficiência da maquinaria NMD causada por mutações genéticas. Em perspectiva, o portal web desenvolvido bem como as análises realizadas podem direcionar estudos para identificar novos alvos terapêuticos para diferentes tipos de câncer, podendo-se também utilizar nosso banco de dados para caracterização de variantes em amostras de antecedentes genéticos desconhecidos, como amostras arquivadas. O portal está disponível em: https://bioinfo.imd.ufrn.br/dbPepVar/.The proteomic approach allows large-scale studies of protein expression in different tissues and body fluids, aiming to identify and quantify the total protein content. In the proteomic analysis process, protein identification still presents limitations despite major advances in the area. Frequently, a mass spectrometer is used to generate mass/charge values of the samples. After this process, a reference protein database (eg, UniProt) is usually used to identify proteins. However, using a reference database limits the analysis of the identification of the proteins, since it does not contain the variations in the DNA that can impact the sequence of amino acids, causing incorrect identification or making the process impossible. In this context, there are several custom databases that incorporate such genetic variations. Although they present good results, they are also limited due to the absence of some mutations, becoming another problem in the identification process. Therefore, this research aims to build a proteogenomic database (dbPepVar) by combining genetic variation information from dbSNP with protein sequences from the NCBI RefSeq. Public mass spectrometry datasets were used to perform a pan-cancer analysis (Ovarian, Colorectal, Breast, and Prostate), allowing the identification of unique genetic variations. In total 3,726 variant peptides were identified in ovarian cancer samples, 2,543 in prostate, 2,661 in breast and 2,411 in colon-rectal cancer. A mutational frequency analysis showed genes involved in tumor progression processes, sensitivity to chemotherapy, and risk of susceptibility to cancer. Interestingly, in many samples, C-terminal peptides from shortened proteins originating from premature termination codon (PTC) events were identified. This indicates that such proteins had escaped Nonsense-mediated decay (NMD) and, not surprisingly, NMD machinery genes are also mutated in the same samples. This suggests that the vestige of the truncated transcript may be associated with NMD machinery inefficiency caused by gene mutations. In perspective, the web portal developed as well as the analysis performed may direct studies to identify new therapeutic targets for different cancer, and one can also use our database for characterization of variants in samples of unknown genetic background, such as archived samples. The portal is available in: https://bioinfo.imd.ufrn.br/dbPepVar/.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESUniversidade Federal do Rio Grande do NortePROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICAUFRNBrasilCNPQ::CIENCIAS BIOLOGICASPeptídeos variantes - abordagem computacionalProteogenômicaPolimorfismoProteômicaBanco de dados personalizadoDesenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficosDevelopment of computational approaches for analysis and identification of polymorphic peptidesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALDesenvolvimentoabordagemcomputacional_Cunha_2022.pdfapplication/pdf7833410https://repositorio.ufrn.br/bitstream/123456789/50991/1/Desenvolvimentoabordagemcomputacional_Cunha_2022.pdf542c5a0b71b14ddfb9ef7af0f3e2bed8MD51123456789/509912023-01-19 15:52:08.264oai:https://repositorio.ufrn.br:123456789/50991Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2023-01-19T18:52:08Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
dc.title.alternative.pt_BR.fl_str_mv Development of computational approaches for analysis and identification of polymorphic peptides
title Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
spellingShingle Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
Cunha, Lucas Marques da
CNPQ::CIENCIAS BIOLOGICAS
Peptídeos variantes - abordagem computacional
Proteogenômica
Polimorfismo
Proteômica
Banco de dados personalizado
title_short Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
title_full Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
title_fullStr Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
title_full_unstemmed Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
title_sort Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos
author Cunha, Lucas Marques da
author_facet Cunha, Lucas Marques da
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv https://orcid.org/0000-0003-1555-2505
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6545545471833974
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1012629455821774
dc.contributor.referees1.none.fl_str_mv Passetti, Fábio
dc.contributor.referees2.none.fl_str_mv Uchoa, Adriana Ferreira
dc.contributor.referees3.none.fl_str_mv Lanza, Daniel Carlos Ferreira
dc.contributor.referees4.none.fl_str_mv Carvalho, Paulo Costa
dc.contributor.author.fl_str_mv Cunha, Lucas Marques da
dc.contributor.advisor-co1.fl_str_mv Medeiros, Silvia Regina Batistuzzo de
dc.contributor.advisor-co1ID.fl_str_mv https://orcid.org/0000-0003-2431-0479
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/5882662534904226
dc.contributor.advisor1.fl_str_mv Souza, Gustavo Antônio de
contributor_str_mv Medeiros, Silvia Regina Batistuzzo de
Souza, Gustavo Antônio de
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS BIOLOGICAS
topic CNPQ::CIENCIAS BIOLOGICAS
Peptídeos variantes - abordagem computacional
Proteogenômica
Polimorfismo
Proteômica
Banco de dados personalizado
dc.subject.por.fl_str_mv Peptídeos variantes - abordagem computacional
Proteogenômica
Polimorfismo
Proteômica
Banco de dados personalizado
description A abordagem proteômica permite estudos em larga escala da expressão proteica em diferentes tecidos e fluidos corporais, tendo como objetivo identificar e quantificar o conteúdo proteico total. No processo de análise proteômica, a identificação de proteínas ainda apresenta lacunas, apesar dos grandes avanços na área. Frequentemente, um espectrômetro de massa é utilizado para gerar valores de massa/carga das amostras. Após esse processo, geralmente utiliza-se um banco de dados de proteínas referência (por exemplo, UniProt) para identificação das proteínas. Porém, utilizar uma base de referência limita as análises de identificação das proteínas, uma vez que não contém as variações que ocorrem no DNA, que podem impactar na sequência de aminoácidos, ocasionando identificação incorreta ou impossibilitando o processo. Nesse contexto, existem diversas bases de dados personalizadas que incorporam tais variações genéticas. Embora apresentem bons resultados, também se limitam devido à ausência de algumas mutações, tornando-se outro problema no processo de identificação. Portanto, essa pesquisa tem como objetivo construir m banco de dados de proteogenômica (dbPepVar) combinando informações de variação genética do dbSNP com sequências de proteínas do RefSeq do NCBI. Conjuntos de dados públicos de espectrometria de massa foram usados para realizar uma análise pan-câncer (Ovário, Colorretal, Mama e Próstata), permitindo a identificação de variações genéticas únicas. No total, 3.726 peptídeos variantes foram identificados em amostras de câncer de ovário, 2.543 em próstata, 2.661 em mama e 2.411 em câncer de cólon-retal. Uma análise de frequência mutacional mostrou genes envolvidos nos processos de progressão tumoral, sensibilidade à quimioterapia e risco de suscetibilidade ao câncer. Curiosamente, em muitas amostras, foram identificados peptídeos C-terminais de proteínas encurtadas originárias de eventos de códon de terminação prematura (PTC). Isso indica que tais proteínas escaparam do decaimento mediado por mutações Nonsense (NMD) e, não surpreendentemente, os genes da maquinaria NMD também estão mutados nas mesmas amostras. Isso sugere que o vestígio do transcrito truncado pode estar associado à ineficiência da maquinaria NMD causada por mutações genéticas. Em perspectiva, o portal web desenvolvido bem como as análises realizadas podem direcionar estudos para identificar novos alvos terapêuticos para diferentes tipos de câncer, podendo-se também utilizar nosso banco de dados para caracterização de variantes em amostras de antecedentes genéticos desconhecidos, como amostras arquivadas. O portal está disponível em: https://bioinfo.imd.ufrn.br/dbPepVar/.
publishDate 2022
dc.date.issued.fl_str_mv 2022-11-29
dc.date.accessioned.fl_str_mv 2023-01-19T18:51:25Z
dc.date.available.fl_str_mv 2023-01-19T18:51:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CUNHA, Lucas Marques da. Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos. Orientador: Gustavo Antônio de Souza. 2022. 89f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/50991
identifier_str_mv CUNHA, Lucas Marques da. Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos. Orientador: Gustavo Antônio de Souza. 2022. 89f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.
url https://repositorio.ufrn.br/handle/123456789/50991
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/50991/1/Desenvolvimentoabordagemcomputacional_Cunha_2022.pdf
bitstream.checksum.fl_str_mv 542c5a0b71b14ddfb9ef7af0f3e2bed8
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1802117611422482432