O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão

Detalhes bibliográficos
Autor(a) principal: Wajnberg, Gabriel
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
Texto Completo: https://www.arca.fiocruz.br/handle/icict/25162
Resumo: Inserções e deleções (INDELs) são exemplos de alterações na sequência de DNA. As alterações causadas por deleções genômicas podem modificar nucleotídeos da região codificadora de proteínas com potencial para alterar os aminoácidos codificados e mudar o quadro de leitura da tradução. Estas deleções podem causar modificações substanciais em proteínas envolvidas com a biologia do câncer. Nós inovamos no uso de um método já existente de matrizes ternárias ao utilizá-lo para identificar deleções genômicas com o uso de dados de transcriptoma de alta vazão (RNA-Seq). Foram usados dados de RNA-Seq para identificar pequenas deleções de até 100 nucleotídeos de comprimento dentro de éxons humanos. Apresentamos dados a partir da análise do genoma de referência humano GRCh37/hg19 e de 66 genomas do projeto 1000G. Foram selecionados aleatoriamente três genomas representando cada uma das 22 populações disponíveis para o mapeamento de RNA-Seq de amostras da linhagem H1975, de seis pacientes não fumantes e de 14 pacientes fumantes de câncer de pulmão. Identificamos deleções de até 100 nucleotídeos que também foram identificadas utilizando o programa Varscan com o genoma de referência GRCh37/hg19. Entre elas, podemos citar uma deleção de 15 nucleotídeos no domínio tirosina kinase localizado no éxon 19 do gene EGFR em amostra tumoral de um paciente não fumante Esta deleção também está previamente anotada na base de dados dbSNP. Em outro paciente não fumante foi encontrada uma deleção de quatro nucleotídeos que alterou o quadro de leitura do gene CTSA em amostras normais e tumorais. Encontramos a via de interferon \03B3 com alta probabilidade de estar alterada ao analisar os dados de pacientes fumantes, entre os genes dessa via em que encontramos alterações estão o INFGR1 e o INFGR2. Encontramos deleções a partir do mapeamento dos transcritos com 66 genomas do projeto 1000G que não encontramos com o mapeamento contra o genoma de referência GRCh37/hg19. Dentre elas, encontramos uma pequena deleção de 13 nucleotídeos no gene EPDR1 que altera o domínio ependimina da proteína codificada. Além desta deleção, uma perda de sete nucleotídeos foi encontrada ao utilizar genomas de ancestralidade europeias como referência. No gene supressor tumoral CDH1, encontramos uma pequena deleção de dois nucleotídeos em pacientes não fumantes usando genomas de ancestralidade europeias e americanas. O oncogene AKT1 apresentou uma deleção de cinco nucleotídeos em três pacientes fumantes. Estes achados poderão ser utilizados para o melhor entendimento da biologia do câncer de pulmão para novos métodos de diagnósticos e tratamentos
id CRUZ_e081de77c717b53cdde26837d958c173
oai_identifier_str oai:www.arca.fiocruz.br:icict/25162
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Wajnberg, GabrielPassetti, Fabio2018-03-07T16:57:49Z2018-03-07T16:57:49Z2017WAJNBERG, Gabriel. O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão. 2017. 140 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de Janeiro, 2017.https://www.arca.fiocruz.br/handle/icict/25162Inserções e deleções (INDELs) são exemplos de alterações na sequência de DNA. As alterações causadas por deleções genômicas podem modificar nucleotídeos da região codificadora de proteínas com potencial para alterar os aminoácidos codificados e mudar o quadro de leitura da tradução. Estas deleções podem causar modificações substanciais em proteínas envolvidas com a biologia do câncer. Nós inovamos no uso de um método já existente de matrizes ternárias ao utilizá-lo para identificar deleções genômicas com o uso de dados de transcriptoma de alta vazão (RNA-Seq). Foram usados dados de RNA-Seq para identificar pequenas deleções de até 100 nucleotídeos de comprimento dentro de éxons humanos. Apresentamos dados a partir da análise do genoma de referência humano GRCh37/hg19 e de 66 genomas do projeto 1000G. Foram selecionados aleatoriamente três genomas representando cada uma das 22 populações disponíveis para o mapeamento de RNA-Seq de amostras da linhagem H1975, de seis pacientes não fumantes e de 14 pacientes fumantes de câncer de pulmão. Identificamos deleções de até 100 nucleotídeos que também foram identificadas utilizando o programa Varscan com o genoma de referência GRCh37/hg19. Entre elas, podemos citar uma deleção de 15 nucleotídeos no domínio tirosina kinase localizado no éxon 19 do gene EGFR em amostra tumoral de um paciente não fumante Esta deleção também está previamente anotada na base de dados dbSNP. Em outro paciente não fumante foi encontrada uma deleção de quatro nucleotídeos que alterou o quadro de leitura do gene CTSA em amostras normais e tumorais. Encontramos a via de interferon \03B3 com alta probabilidade de estar alterada ao analisar os dados de pacientes fumantes, entre os genes dessa via em que encontramos alterações estão o INFGR1 e o INFGR2. Encontramos deleções a partir do mapeamento dos transcritos com 66 genomas do projeto 1000G que não encontramos com o mapeamento contra o genoma de referência GRCh37/hg19. Dentre elas, encontramos uma pequena deleção de 13 nucleotídeos no gene EPDR1 que altera o domínio ependimina da proteína codificada. Além desta deleção, uma perda de sete nucleotídeos foi encontrada ao utilizar genomas de ancestralidade europeias como referência. No gene supressor tumoral CDH1, encontramos uma pequena deleção de dois nucleotídeos em pacientes não fumantes usando genomas de ancestralidade europeias e americanas. O oncogene AKT1 apresentou uma deleção de cinco nucleotídeos em três pacientes fumantes. Estes achados poderão ser utilizados para o melhor entendimento da biologia do câncer de pulmão para novos métodos de diagnósticos e tratamentosInsertions and deletions (INDELs) are examples of genomic changes in the DNA sequence. One main effect of those deletions is the change of the coding region of proteins with the potential to alter the encoded amino acids and cause frameshift mutations. These deletions can cause substantial modifications in proteins involved with the biology of cancer. We innovated in the use of an already existing method, which uses ternary matrices to identify genomic deletions with the use of highthroughput transcriptome data (RNA-Seq). RNA-Seq data were used to identify small deletions up to 100 nucleotides in length within human exons. Here, we present data from the analysis of the human reference genome GRCh37/hg19 and 66 genomes from the 1000G project. We randomly selected three genomes representing each of the 22 available populations for mapping RNA-Seq data of the H1975 cell line, and samples from six nonsmoker patients and from 14 smokers patients with lung cancer. We identified deletions of up to 100 nucleotides that were also identified using the Varscan software when mapping to the reference genome GRCh37/hg19. We identified a small deletion of 15 nucleotides in tyrosine kinase domain in exon 19 in the EGFR gene in a tumor sample from a non-smoker patient. This deletion has been already present in the dbSNP database. In another non-smoker patient, a fournucleotide deletion was found that caused frameshift mutation in the CTSA gene simultaneously in normal and tumor samples Meanwhile, we found the interferon-\03B3 pathway with a high probability of being altered when analyzing the data of smoking patients, among the genes in which we found changes are INFGR1 and INFGR2. We identified deletions when we mapped the transcripts with 66 genomes of the 1000G project, which we did not find while mapping with the reference genome GRCh37/hg19. We identified a small deletion of 13 nucleotides in the EPDR1 gene that alters the ependymal domain of the encoded protein. In addition to this deletion, a loss of seven nucleotides was identified when using European ancestral genomes as a reference sequence. We also identified a small deletion in the CDH1 tumor suppressor of two nucleotides in nonsmoking patients using European and American ancestry genomes and a deletion of five nucleotides in three smoking patients on the AKT1 oncogene. In conclusion, we could use transcriptome data mapped on different genomes of different ancestry to identify small deletions of up to 100 nucleotides. These findings may be used to improve the lung cancer biology knowledge to develop new diagnosis and treatment methodsFundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.porBiologia ComputacionalTranscriptomaGenômicaNeoplasiasDeleção de GenesO impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis2017Instituto Oswaldo CruzFundação Oswaldo CruzRio de JaneiroPrograma de Pós-Graduação em Biologia Computacional e Sistemasinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/25162/1/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALgabriel_wajnberg_ioc_dout_2017.pdfapplication/pdf6785775https://www.arca.fiocruz.br/bitstream/icict/25162/2/gabriel_wajnberg_ioc_dout_2017.pdf9743578402d233d40d3a6c359111075eMD52TEXTgabriel_wajnberg_ioc_dout_2017.pdf.txtgabriel_wajnberg_ioc_dout_2017.pdf.txtExtracted texttext/plain187305https://www.arca.fiocruz.br/bitstream/icict/25162/3/gabriel_wajnberg_ioc_dout_2017.pdf.txt7592a2f3e1e23df18092e101078fe7e3MD53icict/251622022-06-24 13:12:38.402oai:www.arca.fiocruz.br:icict/25162Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352022-06-24T16:12:38Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false
dc.title.pt_BR.fl_str_mv O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
title O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
spellingShingle O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
Wajnberg, Gabriel
Biologia Computacional
Transcriptoma
Genômica
Neoplasias
Deleção de Genes
title_short O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
title_full O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
title_fullStr O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
title_full_unstemmed O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
title_sort O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão
author Wajnberg, Gabriel
author_facet Wajnberg, Gabriel
author_role author
dc.contributor.author.fl_str_mv Wajnberg, Gabriel
dc.contributor.advisor1.fl_str_mv Passetti, Fabio
contributor_str_mv Passetti, Fabio
dc.subject.other.pt_BR.fl_str_mv Biologia Computacional
Transcriptoma
Genômica
Neoplasias
topic Biologia Computacional
Transcriptoma
Genômica
Neoplasias
Deleção de Genes
dc.subject.decs.pt_BR.fl_str_mv Deleção de Genes
description Inserções e deleções (INDELs) são exemplos de alterações na sequência de DNA. As alterações causadas por deleções genômicas podem modificar nucleotídeos da região codificadora de proteínas com potencial para alterar os aminoácidos codificados e mudar o quadro de leitura da tradução. Estas deleções podem causar modificações substanciais em proteínas envolvidas com a biologia do câncer. Nós inovamos no uso de um método já existente de matrizes ternárias ao utilizá-lo para identificar deleções genômicas com o uso de dados de transcriptoma de alta vazão (RNA-Seq). Foram usados dados de RNA-Seq para identificar pequenas deleções de até 100 nucleotídeos de comprimento dentro de éxons humanos. Apresentamos dados a partir da análise do genoma de referência humano GRCh37/hg19 e de 66 genomas do projeto 1000G. Foram selecionados aleatoriamente três genomas representando cada uma das 22 populações disponíveis para o mapeamento de RNA-Seq de amostras da linhagem H1975, de seis pacientes não fumantes e de 14 pacientes fumantes de câncer de pulmão. Identificamos deleções de até 100 nucleotídeos que também foram identificadas utilizando o programa Varscan com o genoma de referência GRCh37/hg19. Entre elas, podemos citar uma deleção de 15 nucleotídeos no domínio tirosina kinase localizado no éxon 19 do gene EGFR em amostra tumoral de um paciente não fumante Esta deleção também está previamente anotada na base de dados dbSNP. Em outro paciente não fumante foi encontrada uma deleção de quatro nucleotídeos que alterou o quadro de leitura do gene CTSA em amostras normais e tumorais. Encontramos a via de interferon \03B3 com alta probabilidade de estar alterada ao analisar os dados de pacientes fumantes, entre os genes dessa via em que encontramos alterações estão o INFGR1 e o INFGR2. Encontramos deleções a partir do mapeamento dos transcritos com 66 genomas do projeto 1000G que não encontramos com o mapeamento contra o genoma de referência GRCh37/hg19. Dentre elas, encontramos uma pequena deleção de 13 nucleotídeos no gene EPDR1 que altera o domínio ependimina da proteína codificada. Além desta deleção, uma perda de sete nucleotídeos foi encontrada ao utilizar genomas de ancestralidade europeias como referência. No gene supressor tumoral CDH1, encontramos uma pequena deleção de dois nucleotídeos em pacientes não fumantes usando genomas de ancestralidade europeias e americanas. O oncogene AKT1 apresentou uma deleção de cinco nucleotídeos em três pacientes fumantes. Estes achados poderão ser utilizados para o melhor entendimento da biologia do câncer de pulmão para novos métodos de diagnósticos e tratamentos
publishDate 2017
dc.date.issued.fl_str_mv 2017
dc.date.accessioned.fl_str_mv 2018-03-07T16:57:49Z
dc.date.available.fl_str_mv 2018-03-07T16:57:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv WAJNBERG, Gabriel. O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão. 2017. 140 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de Janeiro, 2017.
dc.identifier.uri.fl_str_mv https://www.arca.fiocruz.br/handle/icict/25162
identifier_str_mv WAJNBERG, Gabriel. O impacto de pequenas deleções genômicas em domínios protéicos identificadas a partir de dados de rna-seq de amostras de pacientes de adenocarcinoma de pulmão. 2017. 140 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de Janeiro, 2017.
url https://www.arca.fiocruz.br/handle/icict/25162
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://www.arca.fiocruz.br/bitstream/icict/25162/1/license.txt
https://www.arca.fiocruz.br/bitstream/icict/25162/2/gabriel_wajnberg_ioc_dout_2017.pdf
https://www.arca.fiocruz.br/bitstream/icict/25162/3/gabriel_wajnberg_ioc_dout_2017.pdf.txt
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
9743578402d233d40d3a6c359111075e
7592a2f3e1e23df18092e101078fe7e3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1798324703538970624