Avaliação do viés GC em plataformas de sequenciamento de nova geração

Detalhes bibliográficos
Autor(a) principal: PINHEIRO, Kenny da Costa
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPA
Texto Completo: http://repositorio.ufpa.br/jspui/handle/2011/6730
Resumo: O surgimento das plataformas de sequenciamento de nova geração (NGS) proporcionou o aumento do volume de dados produzidos, tornando possível a obtenção de genomas completos. Apesar das vantagens alcançadas com estas plataformas, são observadas regiões de elevada ou baixa cobertura, em relação à média, associadas diretamente ao conteúdo GC. Este viés GC pode afetar análises genômicas e dificultar a montagem de genomas através da abordagem de novo, além de afetar as análises baseadas em referência. Além do que, as maneiras de avaliar o viés GC deve ser adequada para dados com diferentes perfis de relação/associação entre GC e cobertura, tais como linear e quadrático. Desta forma, este trabalho propõe o uso do Coeficiente de Correlação de Pearson (r) para analisar a correlação entre conteúdo GC e Cobertura, permitindo identificar aintensidade da correlação linear e detectar associações não-lineares, além de identificar a relação entre viés GC e as plataformas de sequenciamento. Os sinais positivos e negativos de r também permitem inferir relações diretamente proporcionais e inversamente proporcionais respectivamente. Utilizou-se dados da espécie Corynebacterium pseudotuberculosis, conhecido por serem genomas clonais obtidas através de diferentes tecnologias de sequenciamento para identificar se há relação do viés GC com as plataformas utilizadas.
id UFPA_13237b71e9e978a78f7af5f87e217356
oai_identifier_str oai:repositorio.ufpa.br:2011/6730
network_acronym_str UFPA
network_name_str Repositório Institucional da UFPA
repository_id_str 2123
spelling 2015-05-27T12:38:30Z2015-05-27T12:38:30Z2015-03-05PINHEIRO, Kenny da Costa. Avaliação do viés GC em plataformas de sequenciamento de nova geração. 2015. 59 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Ciências Biológicas, Belém, 2015. Programa de Pós-Graduação em Biotecnologia.http://repositorio.ufpa.br/jspui/handle/2011/6730O surgimento das plataformas de sequenciamento de nova geração (NGS) proporcionou o aumento do volume de dados produzidos, tornando possível a obtenção de genomas completos. Apesar das vantagens alcançadas com estas plataformas, são observadas regiões de elevada ou baixa cobertura, em relação à média, associadas diretamente ao conteúdo GC. Este viés GC pode afetar análises genômicas e dificultar a montagem de genomas através da abordagem de novo, além de afetar as análises baseadas em referência. Além do que, as maneiras de avaliar o viés GC deve ser adequada para dados com diferentes perfis de relação/associação entre GC e cobertura, tais como linear e quadrático. Desta forma, este trabalho propõe o uso do Coeficiente de Correlação de Pearson (r) para analisar a correlação entre conteúdo GC e Cobertura, permitindo identificar aintensidade da correlação linear e detectar associações não-lineares, além de identificar a relação entre viés GC e as plataformas de sequenciamento. Os sinais positivos e negativos de r também permitem inferir relações diretamente proporcionais e inversamente proporcionais respectivamente. Utilizou-se dados da espécie Corynebacterium pseudotuberculosis, conhecido por serem genomas clonais obtidas através de diferentes tecnologias de sequenciamento para identificar se há relação do viés GC com as plataformas utilizadas.The emergence of high throughput sequencing (HTS) platforms increased the amount of data making feasible to obtaining complete genomes. Despite the advantages and the throughput produced by these platforms, the high or low genomic coverage in the regions of the genome can be related to GC content. This GC bias may affect genomic analyzes and the genomic/transcriptomic analysis based on de novo and reference approach. In addition, the ways to evaluate the GC bias should be fit to data with different profiles of the GC vs coverage relationship, such as linear and quadratic. Thus, this work proposes the use of Pearson's Correlation Coefficient (r) to analyze the correlation between GC content and coverage, allowing to identify the strength of linear correlation and detect nonlinear associations, beyond identify a relationship between GC bias and sequencing platforms. The positive and negative signs of r also allow us to infer directly and inversely proportional relationships, respectively. To evaluate the bias, we used the data of Corynebacterium pseudotuberculosis obtained from different sequencing technologies to identify if the CG bias is related to used platforms.FAPESPA - Fundação Amazônia de Amparo a Estudos e PesquisasporUniversidade Federal do ParáPrograma de Pós-Graduação em BiotecnologiaUFPABrasilInstituto de Ciências BiológicasCNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA MOLECULAR E DE MICROORGANISMOSBioinformáticaGenomaCorynebacterium pseudotuberculosisViés GCAvaliação do viés GC em plataformas de sequenciamento de nova geraçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisRAMOS, Rommel Thiago Jucáhttp://lattes.cnpq.br/1274395392752454http://lattes.cnpq.br/7416002922169632PINHEIRO, Kenny da Costainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPAinstname:Universidade Federal do Pará (UFPA)instacron:UFPAORIGINALDissertacao_AvaliacaoViesGC.pdfDissertacao_AvaliacaoViesGC.pdfapplication/pdf2733576http://repositorio.ufpa.br/oai/bitstream/2011/6730/1/Dissertacao_AvaliacaoViesGC.pdf9bd7b306d18c9262798f5c16a04c4c4aMD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-852http://repositorio.ufpa.br/oai/bitstream/2011/6730/2/license_url3d480ae6c91e310daba2020f8787d6f9MD52license_textlicense_texttext/html; charset=utf-819586http://repositorio.ufpa.br/oai/bitstream/2011/6730/3/license_text4b7737e416cd9b597a49c664d50d76ffMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-822974http://repositorio.ufpa.br/oai/bitstream/2011/6730/4/license_rdf99c771d9f0b9c46790009b9874d49253MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81703http://repositorio.ufpa.br/oai/bitstream/2011/6730/5/license.txta12ee01655d4f43dacf016d5e6168febMD55TEXTDissertacao_AvaliacaoViesGC.pdf.txtDissertacao_AvaliacaoViesGC.pdf.txtExtracted texttext/plain70760http://repositorio.ufpa.br/oai/bitstream/2011/6730/6/Dissertacao_AvaliacaoViesGC.pdf.txt5952a88d724caa1d8bcc374fcf7e50a1MD562011/67302017-12-22 10:34:25.999oai:repositorio.ufpa.br:2011/6730TGljZW4/YSBkZSBkaXN0cmlidWk/P28gbj9vIGV4Y2x1c2l2YQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW4/YSwgdm9jPyBvKHMpIGF1dG9yIChlcykgb3UgcHJvcHJpZXQ/cmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgIGNvbmNlZGUgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBQYXI/IC0gVUZQQSwgbyBkaXJlaXRvIG4/byBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgdHJhZHV6aXIgKGNvbW8gZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSBkaXN0cmlidWlyIHN1YSBzdWJtaXNzP28gKGluY2x1aW5kbyBvIHJlc3VtbykgZW0gdG9kbyBvIG11bmRvLCBlbSBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHI/bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbywgbWFzIG4/byBsaW1pdGFkbywgYSA/dWRpbyBvdSB2P2Rlby4KClZvYz8gY29uY29yZGEgcXVlIGEgVUZQQSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlP2RvLCB0cmFkdXppciBhIHN1Ym1pc3M/byBhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIG8gcHJvcD9zaXRvIGRlIHByZXNlcnZhPz9vLgoKVm9jPyB0YW1iP20gY29uY29yZGEgcXVlIFVGUEEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgYz9waWEgZGVzc2Egc3VibWlzcz9vIHBhcmEgZmlucyBkZSBzZWd1cmFuP2EsIGJhY2stdXAgZSBwcmVzZXJ2YT8/by4KClZvYz8gZGVjbGFyYSBxdWUgYSBhcHJlc2VudGE/P28gPyBvIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgdm9jPyB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2VuP2EuIFZvYz8gdGFtYj9tIGRlY2xhcmEgcXVlIHN1YSBzdWJtaXNzP28sIGFvIHNldSBjb25oZWNpbWVudG8sIG4/byBpbmZyaW5nZSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhbGd1P20uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250P20gbWF0ZXJpYWwgcGFyYSBvIHF1YWwgdm9jPyBuP28gdGVtIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2M/IGRlY2xhcmEgcXVlIG9idGV2ZSBhIHBlcm1pc3M/byBpcnJlc3RyaXRhIGRvIHByb3ByaWV0P3JpbyBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhIFVGUEEgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbj9hLCBlIHF1ZSBtYXRlcmlhaXMgZGUgdGVyY2Vpcm9zIGVzdD8gY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZT9kbyBkYSBhcHJlc2VudGE/P28uCgpTZSBhIHN1Ym1pc3M/byA/IGJhc2VhZGEgbm8gdHJhYmFsaG8gcXVlIHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtID9yZz9vIG91IG91dHJhIG9yZ2FuaXphPz9vIHF1ZSBuP28gc2VqYSBhIFVGUEEsIHZvYz8gZGVjbGFyYSB0ZXIgY3VtcHJpZG8gcXVhbHF1ZXIgZGlyZWl0byBkZSByZXZpcz9vIG91IG91dHJhcyBvYnJpZ2E/P2VzIHJlcXVlcmlkYXMgcGVsbyBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEEgaXI/IGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyhzKSBzZXUocykgbm9tZShzKSBjb21vIG8ocykgYXV0b3IgKGVzKSBvdSBwcm9wcmlldD9yaW8ocykgZGEgc3VibWlzcz9vLCBlIG4/byBmYXI/IHF1YWxxdWVyIGFsdGVyYT8/bywgYWw/bSBkYXMgcGVybWl0aWRhcyBwb3IgZXN0YSBsaWNlbj9hLCBhIHN1YSBzdWJtaXNzP28uCgo=Repositório InstitucionalPUBhttp://repositorio.ufpa.br/oai/requestriufpabc@ufpa.bropendoar:21232017-12-22T13:34:25Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)false
dc.title.pt_BR.fl_str_mv Avaliação do viés GC em plataformas de sequenciamento de nova geração
title Avaliação do viés GC em plataformas de sequenciamento de nova geração
spellingShingle Avaliação do viés GC em plataformas de sequenciamento de nova geração
PINHEIRO, Kenny da Costa
CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA MOLECULAR E DE MICROORGANISMOS
Bioinformática
Genoma
Corynebacterium pseudotuberculosis
Viés GC
title_short Avaliação do viés GC em plataformas de sequenciamento de nova geração
title_full Avaliação do viés GC em plataformas de sequenciamento de nova geração
title_fullStr Avaliação do viés GC em plataformas de sequenciamento de nova geração
title_full_unstemmed Avaliação do viés GC em plataformas de sequenciamento de nova geração
title_sort Avaliação do viés GC em plataformas de sequenciamento de nova geração
author PINHEIRO, Kenny da Costa
author_facet PINHEIRO, Kenny da Costa
author_role author
dc.contributor.advisor1.fl_str_mv RAMOS, Rommel Thiago Jucá
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1274395392752454
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7416002922169632
dc.contributor.author.fl_str_mv PINHEIRO, Kenny da Costa
contributor_str_mv RAMOS, Rommel Thiago Jucá
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA MOLECULAR E DE MICROORGANISMOS
topic CNPQ::CIENCIAS BIOLOGICAS::GENETICA::GENETICA MOLECULAR E DE MICROORGANISMOS
Bioinformática
Genoma
Corynebacterium pseudotuberculosis
Viés GC
dc.subject.por.fl_str_mv Bioinformática
Genoma
Corynebacterium pseudotuberculosis
Viés GC
description O surgimento das plataformas de sequenciamento de nova geração (NGS) proporcionou o aumento do volume de dados produzidos, tornando possível a obtenção de genomas completos. Apesar das vantagens alcançadas com estas plataformas, são observadas regiões de elevada ou baixa cobertura, em relação à média, associadas diretamente ao conteúdo GC. Este viés GC pode afetar análises genômicas e dificultar a montagem de genomas através da abordagem de novo, além de afetar as análises baseadas em referência. Além do que, as maneiras de avaliar o viés GC deve ser adequada para dados com diferentes perfis de relação/associação entre GC e cobertura, tais como linear e quadrático. Desta forma, este trabalho propõe o uso do Coeficiente de Correlação de Pearson (r) para analisar a correlação entre conteúdo GC e Cobertura, permitindo identificar aintensidade da correlação linear e detectar associações não-lineares, além de identificar a relação entre viés GC e as plataformas de sequenciamento. Os sinais positivos e negativos de r também permitem inferir relações diretamente proporcionais e inversamente proporcionais respectivamente. Utilizou-se dados da espécie Corynebacterium pseudotuberculosis, conhecido por serem genomas clonais obtidas através de diferentes tecnologias de sequenciamento para identificar se há relação do viés GC com as plataformas utilizadas.
publishDate 2015
dc.date.accessioned.fl_str_mv 2015-05-27T12:38:30Z
dc.date.available.fl_str_mv 2015-05-27T12:38:30Z
dc.date.issued.fl_str_mv 2015-03-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PINHEIRO, Kenny da Costa. Avaliação do viés GC em plataformas de sequenciamento de nova geração. 2015. 59 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Ciências Biológicas, Belém, 2015. Programa de Pós-Graduação em Biotecnologia.
dc.identifier.uri.fl_str_mv http://repositorio.ufpa.br/jspui/handle/2011/6730
identifier_str_mv PINHEIRO, Kenny da Costa. Avaliação do viés GC em plataformas de sequenciamento de nova geração. 2015. 59 f. Dissertação (Mestrado) - Universidade Federal do Pará, Instituto de Ciências Biológicas, Belém, 2015. Programa de Pós-Graduação em Biotecnologia.
url http://repositorio.ufpa.br/jspui/handle/2011/6730
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Pará
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Biotecnologia
dc.publisher.initials.fl_str_mv UFPA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Ciências Biológicas
publisher.none.fl_str_mv Universidade Federal do Pará
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPA
instname:Universidade Federal do Pará (UFPA)
instacron:UFPA
instname_str Universidade Federal do Pará (UFPA)
instacron_str UFPA
institution UFPA
reponame_str Repositório Institucional da UFPA
collection Repositório Institucional da UFPA
bitstream.url.fl_str_mv http://repositorio.ufpa.br/oai/bitstream/2011/6730/1/Dissertacao_AvaliacaoViesGC.pdf
http://repositorio.ufpa.br/oai/bitstream/2011/6730/2/license_url
http://repositorio.ufpa.br/oai/bitstream/2011/6730/3/license_text
http://repositorio.ufpa.br/oai/bitstream/2011/6730/4/license_rdf
http://repositorio.ufpa.br/oai/bitstream/2011/6730/5/license.txt
http://repositorio.ufpa.br/oai/bitstream/2011/6730/6/Dissertacao_AvaliacaoViesGC.pdf.txt
bitstream.checksum.fl_str_mv 9bd7b306d18c9262798f5c16a04c4c4a
3d480ae6c91e310daba2020f8787d6f9
4b7737e416cd9b597a49c664d50d76ff
99c771d9f0b9c46790009b9874d49253
a12ee01655d4f43dacf016d5e6168feb
5952a88d724caa1d8bcc374fcf7e50a1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPA - Universidade Federal do Pará (UFPA)
repository.mail.fl_str_mv riufpabc@ufpa.br
_version_ 1801771884026527744