SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos

Detalhes bibliográficos
Autor(a) principal: Diego César Batista Mariano
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/BUBD-A3QNAQ
Resumo: A evolução das plataformas de sequenciamento em larga escala vem reduzindo o tempo gasto para o processo de decodificação do DNA a um custo reduzido. Porém, os sequenciadores possuem algumas limitações, como por exemplo, o tamanho máximo dos fragmentos de DNA que são capazes de ler. O que leva a necessidade de fragmentar o DNA em pequenos pedaços antes do sequenciamento, sendo necessário, após essa etapa, reordenar os fragmentos lidos (leituras) de forma que se possa representar o genoma original. Esse processo, conhecido como montagem de genomas, pode ser caracterizado pela sua complexidade e dependência pelas limitações dos sequenciadores, o que evidencia a necessidade do uso de diversos programas computacionais. Nos últimos anos, diversas estratégias para montagem de genomas foram propostas, mas ainda não existe um consenso sobre qual a melhor abordagem. Nesse contexto, propõe-se um pipeline para montagem de genomas bacterianos, que será gerenciado por uma aplicação Web com interface amigável denominada SIMBA (Simple Manager for Bacterial Assemblies). Para avaliar sua performance foram feitas as montagens das linhagens Corynebacterium pseudotuberculosis 1002 (originalmente sequenciada nas plataformas 454 Roche e Sanger) e Corynebacterium pseudotuberculosis 258 (originalmente sequenciada na plataforma SOLiD v3) através de cinco diferentes softwares: Mira3, Mira4, Minia, Newbler e SPAdes. Ambas as linhagens foram ressequenciadas com bibliotecas de fragmentos simples de tamanho aproximado a 200pb na plataforma de semicondutores Ion PGM. Após a montagem, escolheu-se um dos cinco resultados para etapa de fechamento de gaps através de duas abordagens: baseada em referência e baseada em mapeamento óptico. Por fim, observou-se que a ferramenta SIMBA permitiu uma rápida e fácil execução do processo de montagem e curadoria dos genomas. O download da ferramenta foi disponibilizado no website: <http://ufmg-simba.sourceforge.net>.
id UFMG_55b01cc1b62f68f88644821029496974
oai_identifier_str oai:repositorio.ufmg.br:1843/BUBD-A3QNAQ
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Vasco Ariston de Carvalho AzevedoRommel Thiago Juca RamosRommel Thiago Juca RamosDiego César Batista Mariano2019-08-10T21:07:13Z2019-08-10T21:07:13Z2015-02-26http://hdl.handle.net/1843/BUBD-A3QNAQA evolução das plataformas de sequenciamento em larga escala vem reduzindo o tempo gasto para o processo de decodificação do DNA a um custo reduzido. Porém, os sequenciadores possuem algumas limitações, como por exemplo, o tamanho máximo dos fragmentos de DNA que são capazes de ler. O que leva a necessidade de fragmentar o DNA em pequenos pedaços antes do sequenciamento, sendo necessário, após essa etapa, reordenar os fragmentos lidos (leituras) de forma que se possa representar o genoma original. Esse processo, conhecido como montagem de genomas, pode ser caracterizado pela sua complexidade e dependência pelas limitações dos sequenciadores, o que evidencia a necessidade do uso de diversos programas computacionais. Nos últimos anos, diversas estratégias para montagem de genomas foram propostas, mas ainda não existe um consenso sobre qual a melhor abordagem. Nesse contexto, propõe-se um pipeline para montagem de genomas bacterianos, que será gerenciado por uma aplicação Web com interface amigável denominada SIMBA (Simple Manager for Bacterial Assemblies). Para avaliar sua performance foram feitas as montagens das linhagens Corynebacterium pseudotuberculosis 1002 (originalmente sequenciada nas plataformas 454 Roche e Sanger) e Corynebacterium pseudotuberculosis 258 (originalmente sequenciada na plataforma SOLiD v3) através de cinco diferentes softwares: Mira3, Mira4, Minia, Newbler e SPAdes. Ambas as linhagens foram ressequenciadas com bibliotecas de fragmentos simples de tamanho aproximado a 200pb na plataforma de semicondutores Ion PGM. Após a montagem, escolheu-se um dos cinco resultados para etapa de fechamento de gaps através de duas abordagens: baseada em referência e baseada em mapeamento óptico. Por fim, observou-se que a ferramenta SIMBA permitiu uma rápida e fácil execução do processo de montagem e curadoria dos genomas. O download da ferramenta foi disponibilizado no website: <http://ufmg-simba.sourceforge.net>.The evolution of large-scale sequencing platforms has reduced the time taken for the process of DNA fingerprinting at a reduced cost and in less time. However, sequencers still have limitations, such as the maximum size of DNA fragments that are capable of reading. What drives the need to break the DNA into small pieces before sequencing, being necessary after this step, to rearrange the fragments (reads) so that it can represent the original genome. This process is known as genome assembly. The genome assembly is a complex process dependent on the limitations of sequencers, so there is the need to use several computer programs. In recent years, several strategies for genome assembly have been proposed, but there is still no consensus on the best approach. In this context, we propose a pipeline for the assembly of bacterial genomes, which will be managed by a web application with user-friendly interface called SIMBA (Simple Bacterial Manager for Assemblies). To evaluate its performance, we assembled the strains Corynebacterium pseudotuberculosis 1002 (originally sequenced in Sanger and Roche 454 platforms) and Corynebacterium pseudotuberculosis 258 (originally sequenced on SOLiD v3 platform) using five different assembly software: Mira3, Mira4, Minia, Newbler and SPAdes. Both strains were resequenced with simple fragments libraries of approximate size to 200pb in the semiconductor Ion PGM platform. After assembly, was chosen one of them to perform the closing of gaps through two approaches: reference-based and optical mapping. Finally, it was observed that the SIMBA tool allows fast and easy execution of the assembly process and curation of genomes. The download of the tool is available at the website: <http://ufmgsimba. sourceforge.net>.Universidade Federal de Minas GeraisUFMGBioinformáticaSIMBASequenciamentoNGSMontagem de genomasWebtoolSIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdisserta__o_v5.9_final.pdfapplication/pdf6398171https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/1/disserta__o_v5.9_final.pdfcd5b3e6813aa647676a782ef54695297MD51TEXTdisserta__o_v5.9_final.pdf.txtdisserta__o_v5.9_final.pdf.txtExtracted texttext/plain145485https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/2/disserta__o_v5.9_final.pdf.txtceb1e94cc814175a82e1864ba0b84cdbMD521843/BUBD-A3QNAQ2019-11-14 10:51:06.711oai:repositorio.ufmg.br:1843/BUBD-A3QNAQRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T13:51:06Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
title SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
spellingShingle SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
Diego César Batista Mariano
SIMBA
Sequenciamento
NGS
Montagem de genomas
Webtool
Bioinformática
title_short SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
title_full SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
title_fullStr SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
title_full_unstemmed SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
title_sort SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
author Diego César Batista Mariano
author_facet Diego César Batista Mariano
author_role author
dc.contributor.advisor1.fl_str_mv Vasco Ariston de Carvalho Azevedo
dc.contributor.advisor-co1.fl_str_mv Rommel Thiago Juca Ramos
dc.contributor.referee1.fl_str_mv Rommel Thiago Juca Ramos
dc.contributor.author.fl_str_mv Diego César Batista Mariano
contributor_str_mv Vasco Ariston de Carvalho Azevedo
Rommel Thiago Juca Ramos
Rommel Thiago Juca Ramos
dc.subject.por.fl_str_mv SIMBA
Sequenciamento
NGS
Montagem de genomas
Webtool
topic SIMBA
Sequenciamento
NGS
Montagem de genomas
Webtool
Bioinformática
dc.subject.other.pt_BR.fl_str_mv Bioinformática
description A evolução das plataformas de sequenciamento em larga escala vem reduzindo o tempo gasto para o processo de decodificação do DNA a um custo reduzido. Porém, os sequenciadores possuem algumas limitações, como por exemplo, o tamanho máximo dos fragmentos de DNA que são capazes de ler. O que leva a necessidade de fragmentar o DNA em pequenos pedaços antes do sequenciamento, sendo necessário, após essa etapa, reordenar os fragmentos lidos (leituras) de forma que se possa representar o genoma original. Esse processo, conhecido como montagem de genomas, pode ser caracterizado pela sua complexidade e dependência pelas limitações dos sequenciadores, o que evidencia a necessidade do uso de diversos programas computacionais. Nos últimos anos, diversas estratégias para montagem de genomas foram propostas, mas ainda não existe um consenso sobre qual a melhor abordagem. Nesse contexto, propõe-se um pipeline para montagem de genomas bacterianos, que será gerenciado por uma aplicação Web com interface amigável denominada SIMBA (Simple Manager for Bacterial Assemblies). Para avaliar sua performance foram feitas as montagens das linhagens Corynebacterium pseudotuberculosis 1002 (originalmente sequenciada nas plataformas 454 Roche e Sanger) e Corynebacterium pseudotuberculosis 258 (originalmente sequenciada na plataforma SOLiD v3) através de cinco diferentes softwares: Mira3, Mira4, Minia, Newbler e SPAdes. Ambas as linhagens foram ressequenciadas com bibliotecas de fragmentos simples de tamanho aproximado a 200pb na plataforma de semicondutores Ion PGM. Após a montagem, escolheu-se um dos cinco resultados para etapa de fechamento de gaps através de duas abordagens: baseada em referência e baseada em mapeamento óptico. Por fim, observou-se que a ferramenta SIMBA permitiu uma rápida e fácil execução do processo de montagem e curadoria dos genomas. O download da ferramenta foi disponibilizado no website: <http://ufmg-simba.sourceforge.net>.
publishDate 2015
dc.date.issued.fl_str_mv 2015-02-26
dc.date.accessioned.fl_str_mv 2019-08-10T21:07:13Z
dc.date.available.fl_str_mv 2019-08-10T21:07:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUBD-A3QNAQ
url http://hdl.handle.net/1843/BUBD-A3QNAQ
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/1/disserta__o_v5.9_final.pdf
https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/2/disserta__o_v5.9_final.pdf.txt
bitstream.checksum.fl_str_mv cd5b3e6813aa647676a782ef54695297
ceb1e94cc814175a82e1864ba0b84cdb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801677049362907136