Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica

Detalhes bibliográficos
Autor(a) principal: Silva, Raphael Tavares da
Data de Publicação: 2016
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
Texto Completo: https://www.arca.fiocruz.br/handle/icict/18748
Resumo: Os avanços obtidos no estudo do transcriptoma pelo uso de sequenciadores de alta vazão e na proteômica por meio da espectrometria de massas, resultaram num grande volume de dados que passou a ser integrado em diversos estudos na Bioinformática. A proteogenômica é a área da pesquisa que reúne essas tecnologias, atuando na interface entre a genômica e a proteômica para interpretar eventos moleculares como, por exemplo, o splicing alternativo. Este evento é capaz de gerar RNAs mensageiros diferentes de um mesmo gene, podendo alterar a sequência polipeptídica após a tradução e consequentemente afetar a função das proteínas. Estudos utilizando dados de RNA-Seq, estimaram que até 90% dos genes humanos sejam afetados por este evento, expandindo assim, a capacidade de geração de proteínas com diferentes funções. Esta tese reúne o desenvolvimento e a aplicação de diferentes abordagens voltadas para a identificação de variantes de splicing em dados de espectrometria de massas de linhagens celulares e amostras de diferentes tecidos de homem e camundongo. Para tal, foram criados repositórios personalizados de sequências proteicas, constituídos por sequências canônicas e peptídeos digeridos in silico derivados de isoformas preditas computacionalmente. O primeiro repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem de células T. Foram identificados 54 peptídeos oriundos de variantes de splicing que não seriam identificados utilizando repositórios tradicionais. O segundo repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem celular de oligodendrócitos humanos. Foram identificadas 39 isoformas que apresentaram um perfil de atuação no citoesqueleto desse tipo celular, além de terem sua função discutida no âmbito do tecido cerebral Algumas destas variantes de splicing tiveram a expressão de seus mRNAs confirmada experimentalmente (EEF1D, KRAS, MFF, SDR39U1 e SUGT1). Ademais, foram apresentadas propostas para atribuir maior confiabilidade às isoformas encontradas a partir do número de espectros e peptídeos únicos. O terceiro e quarto repositórios personalizados foram usados em dados de espectrometria de massas das regiões cerebrais de homem e camundongo. Para a composição desses repositórios foi utilizada a montagem de transcriptoma com genoma de referência e de novo para reconstrução de transcritos provenientes de corridas de RNA-Seq. Foram identificadas variantes de splicing já conhecidas e exclusivas derivadas da montagem de transcriptoma. Entre os genes das isoformas encontradas na região do corpo caloso de homem e camundongo, sete foram identificados como ortólogos (CDC42, TPM3, EEF1D, PKM, SEPT7, SET e RUFY3). Até o momento, as abordagens desenvolvidas indicam que a utilização de repositórios proteicos personalizados e a montagem de transcriptoma contribuem para a identificação de isoformas anotadas e potencias variantes de splicing
id CRUZ_8e546f96daad2a20ad350b101c533b17
oai_identifier_str oai:www.arca.fiocruz.br:icict/18748
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Silva, Raphael Tavares daRuiz, Jerônimo ConceiçãoJunqueira, Magno RodriguezMarchini, Fabrício KleryntonVicente, Ana Carolina PauloNogueira, Eduardo de MatosPassetti, FabioScherer, Nicole de Miranda2017-05-04T13:18:12Z2017-05-04T13:18:12Z2016SILVA, R. T. da. Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica. 2016. 143f. Tese (Doutorado em Biologia Computacional e Sistemas) - Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de janeiro, RJ, 2016https://www.arca.fiocruz.br/handle/icict/18748Os avanços obtidos no estudo do transcriptoma pelo uso de sequenciadores de alta vazão e na proteômica por meio da espectrometria de massas, resultaram num grande volume de dados que passou a ser integrado em diversos estudos na Bioinformática. A proteogenômica é a área da pesquisa que reúne essas tecnologias, atuando na interface entre a genômica e a proteômica para interpretar eventos moleculares como, por exemplo, o splicing alternativo. Este evento é capaz de gerar RNAs mensageiros diferentes de um mesmo gene, podendo alterar a sequência polipeptídica após a tradução e consequentemente afetar a função das proteínas. Estudos utilizando dados de RNA-Seq, estimaram que até 90% dos genes humanos sejam afetados por este evento, expandindo assim, a capacidade de geração de proteínas com diferentes funções. Esta tese reúne o desenvolvimento e a aplicação de diferentes abordagens voltadas para a identificação de variantes de splicing em dados de espectrometria de massas de linhagens celulares e amostras de diferentes tecidos de homem e camundongo. Para tal, foram criados repositórios personalizados de sequências proteicas, constituídos por sequências canônicas e peptídeos digeridos in silico derivados de isoformas preditas computacionalmente. O primeiro repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem de células T. Foram identificados 54 peptídeos oriundos de variantes de splicing que não seriam identificados utilizando repositórios tradicionais. O segundo repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem celular de oligodendrócitos humanos. Foram identificadas 39 isoformas que apresentaram um perfil de atuação no citoesqueleto desse tipo celular, além de terem sua função discutida no âmbito do tecido cerebral Algumas destas variantes de splicing tiveram a expressão de seus mRNAs confirmada experimentalmente (EEF1D, KRAS, MFF, SDR39U1 e SUGT1). Ademais, foram apresentadas propostas para atribuir maior confiabilidade às isoformas encontradas a partir do número de espectros e peptídeos únicos. O terceiro e quarto repositórios personalizados foram usados em dados de espectrometria de massas das regiões cerebrais de homem e camundongo. Para a composição desses repositórios foi utilizada a montagem de transcriptoma com genoma de referência e de novo para reconstrução de transcritos provenientes de corridas de RNA-Seq. Foram identificadas variantes de splicing já conhecidas e exclusivas derivadas da montagem de transcriptoma. Entre os genes das isoformas encontradas na região do corpo caloso de homem e camundongo, sete foram identificados como ortólogos (CDC42, TPM3, EEF1D, PKM, SEPT7, SET e RUFY3). Até o momento, as abordagens desenvolvidas indicam que a utilização de repositórios proteicos personalizados e a montagem de transcriptoma contribuem para a identificação de isoformas anotadas e potencias variantes de splicingTechnological improvements in data generation in transcriptomics by next generation sequencers, and in proteomics by mass spectrometry resulted in a large volume of data, which is progressively becaming integrated in Bioinformatics studies. Proteogenomics is a research area in which these technologies are combined, acting in the interface of genomics and proteomics to elucidate molecular events, for instance, alternative splicing. This event is capable to alternatively process different mRNAs from the same gene, and its translation to polypeptide sequence may be affected, consequently influencing protein function. Studies using RNA-Seq estimated that at least 90% of human genes are subject to alternative splicing, expanding the number of functionally different proteins. The aim of this thesis is the development and application of different approaches focused on alternative splicing isoforms in mass spectrometry data from cell lines and different samples from human and mouse tissues. For this purpose, we designed customized protein sequence repositories, composed by canonical sequences and in silico digested peptides from predicted isoforms. The first customized repository was applied to mass spectrometry data of a T cell line. We were able to identify 54 peptides derived by splicing variants, which could not be detected using canonical protein sequence repositories The second customized repository was applied to mass spectrometry data of a human oligodendrocyte cell line. The 39 isoforms found are related to cytoskeleton in this cell type, and their functions in the cerebral tissue context have been considered. Five of these splicing variants were experimentally validated (EEF1D, KRAS, MFF, SDR39U1 e SUGT1). We propose an approach to assign reliability to the isoforms identified by their number of unique peptides and spectra. The third customized repository was applied to mass spectrometry data of brain regions from human and mouse. For this purpose, genome-guided and de novo transcriptome assembly were used to reconstruct transcripts from RNA-Seq data. We detected annotated alternative splicing isoforms as well as isoforms predicted by the computational transcriptome assembly. Comparing the isoforms identified in corpus callosum of human and mouse, seven were classified as orthologs (CDC42, TPM3, EEF1D, PKM, SEPT7, SET e RUFY3). The developed approaches show that customized protein repositories and transcriptome assembly contribute to identify annotated isoforms and potential alternative splicing variantsFundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, BrasilporAnálise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis2016-06-24Pós-graduação em Biologia Computacional e SistemasFundação Oswaldo Cruz. Instituto Oswaldo CruzRio de Janeiro/RJPrograma de Pós-graduação em Biologia Computacional e SistemasBiologia ComputacionalProcessamento AlternativoEspectrometria de MassasGenômicaProteômicaAnálise de Sequência de RNAinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/18748/1/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALraphael_silva_ioc_dout_2016.pdfraphael_silva_ioc_dout_2016.pdfapplication/pdf13223246https://www.arca.fiocruz.br/bitstream/icict/18748/2/raphael_silva_ioc_dout_2016.pdf7f9b48c32a21c58e9e1f0a1a3daca191MD52TEXTraphael_silva_ioc_dout_2016.pdf.txtraphael_silva_ioc_dout_2016.pdf.txtExtracted texttext/plain233183https://www.arca.fiocruz.br/bitstream/icict/18748/3/raphael_silva_ioc_dout_2016.pdf.txt9a22a8e46949862e7d3bd890c0c03573MD53icict/187482018-08-15 03:20:34.49oai:www.arca.fiocruz.br:icict/18748Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352018-08-15T06:20:34Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false
dc.title.pt_BR.fl_str_mv Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
title Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
spellingShingle Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
Silva, Raphael Tavares da
Biologia Computacional
Processamento Alternativo
Espectrometria de Massas
Genômica
Proteômica
Análise de Sequência de RNA
title_short Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
title_full Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
title_fullStr Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
title_full_unstemmed Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
title_sort Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica
author Silva, Raphael Tavares da
author_facet Silva, Raphael Tavares da
author_role author
dc.contributor.member.none.fl_str_mv Ruiz, Jerônimo Conceição
Junqueira, Magno Rodriguez
Marchini, Fabrício Klerynton
Vicente, Ana Carolina Paulo
Nogueira, Eduardo de Matos
dc.contributor.author.fl_str_mv Silva, Raphael Tavares da
dc.contributor.advisor1.fl_str_mv Passetti, Fabio
Scherer, Nicole de Miranda
contributor_str_mv Passetti, Fabio
Scherer, Nicole de Miranda
dc.subject.decs.pt_BR.fl_str_mv Biologia Computacional
Processamento Alternativo
Espectrometria de Massas
Genômica
Proteômica
Análise de Sequência de RNA
topic Biologia Computacional
Processamento Alternativo
Espectrometria de Massas
Genômica
Proteômica
Análise de Sequência de RNA
description Os avanços obtidos no estudo do transcriptoma pelo uso de sequenciadores de alta vazão e na proteômica por meio da espectrometria de massas, resultaram num grande volume de dados que passou a ser integrado em diversos estudos na Bioinformática. A proteogenômica é a área da pesquisa que reúne essas tecnologias, atuando na interface entre a genômica e a proteômica para interpretar eventos moleculares como, por exemplo, o splicing alternativo. Este evento é capaz de gerar RNAs mensageiros diferentes de um mesmo gene, podendo alterar a sequência polipeptídica após a tradução e consequentemente afetar a função das proteínas. Estudos utilizando dados de RNA-Seq, estimaram que até 90% dos genes humanos sejam afetados por este evento, expandindo assim, a capacidade de geração de proteínas com diferentes funções. Esta tese reúne o desenvolvimento e a aplicação de diferentes abordagens voltadas para a identificação de variantes de splicing em dados de espectrometria de massas de linhagens celulares e amostras de diferentes tecidos de homem e camundongo. Para tal, foram criados repositórios personalizados de sequências proteicas, constituídos por sequências canônicas e peptídeos digeridos in silico derivados de isoformas preditas computacionalmente. O primeiro repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem de células T. Foram identificados 54 peptídeos oriundos de variantes de splicing que não seriam identificados utilizando repositórios tradicionais. O segundo repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem celular de oligodendrócitos humanos. Foram identificadas 39 isoformas que apresentaram um perfil de atuação no citoesqueleto desse tipo celular, além de terem sua função discutida no âmbito do tecido cerebral Algumas destas variantes de splicing tiveram a expressão de seus mRNAs confirmada experimentalmente (EEF1D, KRAS, MFF, SDR39U1 e SUGT1). Ademais, foram apresentadas propostas para atribuir maior confiabilidade às isoformas encontradas a partir do número de espectros e peptídeos únicos. O terceiro e quarto repositórios personalizados foram usados em dados de espectrometria de massas das regiões cerebrais de homem e camundongo. Para a composição desses repositórios foi utilizada a montagem de transcriptoma com genoma de referência e de novo para reconstrução de transcritos provenientes de corridas de RNA-Seq. Foram identificadas variantes de splicing já conhecidas e exclusivas derivadas da montagem de transcriptoma. Entre os genes das isoformas encontradas na região do corpo caloso de homem e camundongo, sete foram identificados como ortólogos (CDC42, TPM3, EEF1D, PKM, SEPT7, SET e RUFY3). Até o momento, as abordagens desenvolvidas indicam que a utilização de repositórios proteicos personalizados e a montagem de transcriptoma contribuem para a identificação de isoformas anotadas e potencias variantes de splicing
publishDate 2016
dc.date.issued.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2017-05-04T13:18:12Z
dc.date.available.fl_str_mv 2017-05-04T13:18:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, R. T. da. Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica. 2016. 143f. Tese (Doutorado em Biologia Computacional e Sistemas) - Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de janeiro, RJ, 2016
dc.identifier.uri.fl_str_mv https://www.arca.fiocruz.br/handle/icict/18748
identifier_str_mv SILVA, R. T. da. Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica. 2016. 143f. Tese (Doutorado em Biologia Computacional e Sistemas) - Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de janeiro, RJ, 2016
url https://www.arca.fiocruz.br/handle/icict/18748
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://www.arca.fiocruz.br/bitstream/icict/18748/1/license.txt
https://www.arca.fiocruz.br/bitstream/icict/18748/2/raphael_silva_ioc_dout_2016.pdf
https://www.arca.fiocruz.br/bitstream/icict/18748/3/raphael_silva_ioc_dout_2016.pdf.txt
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
7f9b48c32a21c58e9e1f0a1a3daca191
9a22a8e46949862e7d3bd890c0c03573
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1798324974174339072