G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos

Detalhes bibliográficos
Autor(a) principal: Guizelini, Dieval
Data de Publicação: 2016
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: http://hdl.handle.net/1884/44707
Resumo: Orientador : Prof. Dr. Fábio de Oliveira Pedrosa
id UFPR_5b43d291633544ddb8b6cb38fa40ddf7
oai_identifier_str oai:acervodigital.ufpr.br:1884/44707
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Guizelini, DievalSteffens, Maria Berenice ReynaudRaittz, Roberto TadeuUniversidade Federal do Paraná. Setor de Ciências Biológicas. Programa de Pós-Graduação em Ciências (Bioquímica)Pedrosa, Fábio de Oliveira, 1947-2017-01-03T18:09:16Z2017-01-03T18:09:16Z2016http://hdl.handle.net/1884/44707Orientador : Prof. Dr. Fábio de Oliveira PedrosaCoorientadores : Profª. Drª. Maria Berenice Reynaud Steffens e Prof. Dr. Roberto Tadeu RaittzTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Biológicas, Programa de Pós-Graduação em Ciências : Bioquímica. Defesa: Curitiba, 27/07/2016Inclui referências: f. 113-121Resumo: O processo de reconstrução completa da sequência de DNA dos genomas bacterianos ainda é complexo. Apenas 13% dos projetos de sequenciamento de genomas procarióticos são concluídos. Versões rascunho da sequência do genoma são depositadas nos bancos de dados públicos, na forma fragmentada de contigs e com prováveis perdas de informações gênicas. Esta tese tem o objetivo de identificar erros de montagem e melhorar o processo de montagem de genomas de bactérias. Padrões biólogos observados em sequências genômicas e a utilização de informação a priori permitem a identificação de regiões com erros de montagem, reorganizar as sequências e melhorar a montagem do genoma. Com a finalidade de melhorar a finalização das montagens, os contigs são quebrados nos pontos de máximo e mínimo local da curva Fuzzy-GC-Skew e armazenados em nós de um grafo sem bordas. Esses nós são ordenados com base na sequência de referência e submetidos para fechamento das lacunas pelo jFGap. No método desenvolvido neste trabalho - G-Finisher -, os contigs são quebrados nos pontos críticos da curva Fuzzy GC Skew, reordenados e as lacunas fechadas com o jFGap. O G-Finisher foi testado nas 96 montagens obtidas pelo GAGE-B e reduziu na média 86% o número de contigs. G-Finisher pode facilmente melhorar os projetos de montagens de genomas de procariotos, de modo que os programas de montagem podem ser melhorados com a incorporação do G-Finisher ou com a utilização de padrões de sequências biológicas. O software e o código-fonte, escrito em Java, foram licenciados na forma do software livre e disponibilizados em http://gfinisher.sourceforge.net/.Abstract: The process of reconstruction of complete genome from DNA sequences is still complex. Only 13% of the prokaryotic genome sequencing projects are completely finished. Draft genome sequences deposited in public databases are fragmented in contigs and may lack the full gene content. To identify assembly errors and improve the assembly process of bacterial genomes are the purpose of this work. The biological patterns observed in genomic sequences and the application of a priori information allows the identification of misassembled regions, and the reorganization and improvement of the overall genome assembly. In order to improve the finishing of genome assemblies the contigs are broken down at the peaks (all critical points) of a Fuzzy-GC-Skew-Moving-Average graph and stored in computer nodes in a graph data structure without edges. These nodes are ordered following a reference and submitted to the gap closing software jFGap. In the proposed new method - GFinisher - critical peaks in Fuzzy GC skew graphs are broken down, reassembled and closed using jFGap. The number of contigs decreases by up 86%. This has been successfully applied to the 96 genome assemblies described and provide by GAGE-B. GFinisher can easily optimize assemblies of prokaryotic draft genomes and can be used to improve the assembly programs using biological genome sequence patterns. The software was written em Java, licensed in open-source and the binaires and source code are available at http://gfinisher.sourceforge.net/. Keywords: genome finisher, gap close, contig order, genome assembly151 f. : il. algumas color.application/pdfDisponível em formato digitalGenomasBactériasG-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - DIEVAL GUIZELINI.pdfapplication/pdf3449793https://acervodigital.ufpr.br/bitstream/1884/44707/1/R%20-%20T%20-%20DIEVAL%20GUIZELINI.pdfe5dc666a7fc63a8d7417a1928f1a4f71MD51open accessTEXTR - T - DIEVAL GUIZELINI.pdf.txtR - T - DIEVAL GUIZELINI.pdf.txtExtracted Texttext/plain233017https://acervodigital.ufpr.br/bitstream/1884/44707/2/R%20-%20T%20-%20DIEVAL%20GUIZELINI.pdf.txt39b1b8996ca576503cc3aad055dd6016MD52open accessTHUMBNAILR - T - DIEVAL GUIZELINI.pdf.jpgR - T - DIEVAL GUIZELINI.pdf.jpgGenerated Thumbnailimage/jpeg1107https://acervodigital.ufpr.br/bitstream/1884/44707/3/R%20-%20T%20-%20DIEVAL%20GUIZELINI.pdf.jpg8855dbc727de3a769c14056df5059b54MD53open access1884/447072017-01-04 03:04:52.073open accessoai:acervodigital.ufpr.br:1884/44707Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082017-01-04T05:04:52Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.none.fl_str_mv G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
title G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
spellingShingle G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
Guizelini, Dieval
Genomas
Bactérias
title_short G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
title_full G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
title_fullStr G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
title_full_unstemmed G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
title_sort G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos
author Guizelini, Dieval
author_facet Guizelini, Dieval
author_role author
dc.contributor.other.none.fl_str_mv Steffens, Maria Berenice Reynaud
Raittz, Roberto Tadeu
Universidade Federal do Paraná. Setor de Ciências Biológicas. Programa de Pós-Graduação em Ciências (Bioquímica)
dc.contributor.author.fl_str_mv Guizelini, Dieval
dc.contributor.advisor1.fl_str_mv Pedrosa, Fábio de Oliveira, 1947-
contributor_str_mv Pedrosa, Fábio de Oliveira, 1947-
dc.subject.por.fl_str_mv Genomas
Bactérias
topic Genomas
Bactérias
description Orientador : Prof. Dr. Fábio de Oliveira Pedrosa
publishDate 2016
dc.date.issued.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2017-01-03T18:09:16Z
dc.date.available.fl_str_mv 2017-01-03T18:09:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1884/44707
url http://hdl.handle.net/1884/44707
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 151 f. : il. algumas color.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/44707/1/R%20-%20T%20-%20DIEVAL%20GUIZELINI.pdf
https://acervodigital.ufpr.br/bitstream/1884/44707/2/R%20-%20T%20-%20DIEVAL%20GUIZELINI.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/44707/3/R%20-%20T%20-%20DIEVAL%20GUIZELINI.pdf.jpg
bitstream.checksum.fl_str_mv e5dc666a7fc63a8d7417a1928f1a4f71
39b1b8996ca576503cc3aad055dd6016
8855dbc727de3a769c14056df5059b54
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860517213503488