SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/BUBD-A3QNAQ |
Resumo: | A evolução das plataformas de sequenciamento em larga escala vem reduzindo o tempo gasto para o processo de decodificação do DNA a um custo reduzido. Porém, os sequenciadores possuem algumas limitações, como por exemplo, o tamanho máximo dos fragmentos de DNA que são capazes de ler. O que leva a necessidade de fragmentar o DNA em pequenos pedaços antes do sequenciamento, sendo necessário, após essa etapa, reordenar os fragmentos lidos (leituras) de forma que se possa representar o genoma original. Esse processo, conhecido como montagem de genomas, pode ser caracterizado pela sua complexidade e dependência pelas limitações dos sequenciadores, o que evidencia a necessidade do uso de diversos programas computacionais. Nos últimos anos, diversas estratégias para montagem de genomas foram propostas, mas ainda não existe um consenso sobre qual a melhor abordagem. Nesse contexto, propõe-se um pipeline para montagem de genomas bacterianos, que será gerenciado por uma aplicação Web com interface amigável denominada SIMBA (Simple Manager for Bacterial Assemblies). Para avaliar sua performance foram feitas as montagens das linhagens Corynebacterium pseudotuberculosis 1002 (originalmente sequenciada nas plataformas 454 Roche e Sanger) e Corynebacterium pseudotuberculosis 258 (originalmente sequenciada na plataforma SOLiD v3) através de cinco diferentes softwares: Mira3, Mira4, Minia, Newbler e SPAdes. Ambas as linhagens foram ressequenciadas com bibliotecas de fragmentos simples de tamanho aproximado a 200pb na plataforma de semicondutores Ion PGM. Após a montagem, escolheu-se um dos cinco resultados para etapa de fechamento de gaps através de duas abordagens: baseada em referência e baseada em mapeamento óptico. Por fim, observou-se que a ferramenta SIMBA permitiu uma rápida e fácil execução do processo de montagem e curadoria dos genomas. O download da ferramenta foi disponibilizado no website: <http://ufmg-simba.sourceforge.net>. |
id |
UFMG_55b01cc1b62f68f88644821029496974 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/BUBD-A3QNAQ |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Vasco Ariston de Carvalho AzevedoRommel Thiago Juca RamosRommel Thiago Juca RamosDiego César Batista Mariano2019-08-10T21:07:13Z2019-08-10T21:07:13Z2015-02-26http://hdl.handle.net/1843/BUBD-A3QNAQA evolução das plataformas de sequenciamento em larga escala vem reduzindo o tempo gasto para o processo de decodificação do DNA a um custo reduzido. Porém, os sequenciadores possuem algumas limitações, como por exemplo, o tamanho máximo dos fragmentos de DNA que são capazes de ler. O que leva a necessidade de fragmentar o DNA em pequenos pedaços antes do sequenciamento, sendo necessário, após essa etapa, reordenar os fragmentos lidos (leituras) de forma que se possa representar o genoma original. Esse processo, conhecido como montagem de genomas, pode ser caracterizado pela sua complexidade e dependência pelas limitações dos sequenciadores, o que evidencia a necessidade do uso de diversos programas computacionais. Nos últimos anos, diversas estratégias para montagem de genomas foram propostas, mas ainda não existe um consenso sobre qual a melhor abordagem. Nesse contexto, propõe-se um pipeline para montagem de genomas bacterianos, que será gerenciado por uma aplicação Web com interface amigável denominada SIMBA (Simple Manager for Bacterial Assemblies). Para avaliar sua performance foram feitas as montagens das linhagens Corynebacterium pseudotuberculosis 1002 (originalmente sequenciada nas plataformas 454 Roche e Sanger) e Corynebacterium pseudotuberculosis 258 (originalmente sequenciada na plataforma SOLiD v3) através de cinco diferentes softwares: Mira3, Mira4, Minia, Newbler e SPAdes. Ambas as linhagens foram ressequenciadas com bibliotecas de fragmentos simples de tamanho aproximado a 200pb na plataforma de semicondutores Ion PGM. Após a montagem, escolheu-se um dos cinco resultados para etapa de fechamento de gaps através de duas abordagens: baseada em referência e baseada em mapeamento óptico. Por fim, observou-se que a ferramenta SIMBA permitiu uma rápida e fácil execução do processo de montagem e curadoria dos genomas. O download da ferramenta foi disponibilizado no website: <http://ufmg-simba.sourceforge.net>.The evolution of large-scale sequencing platforms has reduced the time taken for the process of DNA fingerprinting at a reduced cost and in less time. However, sequencers still have limitations, such as the maximum size of DNA fragments that are capable of reading. What drives the need to break the DNA into small pieces before sequencing, being necessary after this step, to rearrange the fragments (reads) so that it can represent the original genome. This process is known as genome assembly. The genome assembly is a complex process dependent on the limitations of sequencers, so there is the need to use several computer programs. In recent years, several strategies for genome assembly have been proposed, but there is still no consensus on the best approach. In this context, we propose a pipeline for the assembly of bacterial genomes, which will be managed by a web application with user-friendly interface called SIMBA (Simple Bacterial Manager for Assemblies). To evaluate its performance, we assembled the strains Corynebacterium pseudotuberculosis 1002 (originally sequenced in Sanger and Roche 454 platforms) and Corynebacterium pseudotuberculosis 258 (originally sequenced on SOLiD v3 platform) using five different assembly software: Mira3, Mira4, Minia, Newbler and SPAdes. Both strains were resequenced with simple fragments libraries of approximate size to 200pb in the semiconductor Ion PGM platform. After assembly, was chosen one of them to perform the closing of gaps through two approaches: reference-based and optical mapping. Finally, it was observed that the SIMBA tool allows fast and easy execution of the assembly process and curation of genomes. The download of the tool is available at the website: <http://ufmgsimba. sourceforge.net>.Universidade Federal de Minas GeraisUFMGBioinformáticaSIMBASequenciamentoNGSMontagem de genomasWebtoolSIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdisserta__o_v5.9_final.pdfapplication/pdf6398171https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/1/disserta__o_v5.9_final.pdfcd5b3e6813aa647676a782ef54695297MD51TEXTdisserta__o_v5.9_final.pdf.txtdisserta__o_v5.9_final.pdf.txtExtracted texttext/plain145485https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/2/disserta__o_v5.9_final.pdf.txtceb1e94cc814175a82e1864ba0b84cdbMD521843/BUBD-A3QNAQ2019-11-14 10:51:06.711oai:repositorio.ufmg.br:1843/BUBD-A3QNAQRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T13:51:06Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos |
title |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos |
spellingShingle |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos Diego César Batista Mariano SIMBA Sequenciamento NGS Montagem de genomas Webtool Bioinformática |
title_short |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos |
title_full |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos |
title_fullStr |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos |
title_full_unstemmed |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos |
title_sort |
SIMBA: uma ferramenta Web para gerenciamento de montagens de genomas bacterianos |
author |
Diego César Batista Mariano |
author_facet |
Diego César Batista Mariano |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Vasco Ariston de Carvalho Azevedo |
dc.contributor.advisor-co1.fl_str_mv |
Rommel Thiago Juca Ramos |
dc.contributor.referee1.fl_str_mv |
Rommel Thiago Juca Ramos |
dc.contributor.author.fl_str_mv |
Diego César Batista Mariano |
contributor_str_mv |
Vasco Ariston de Carvalho Azevedo Rommel Thiago Juca Ramos Rommel Thiago Juca Ramos |
dc.subject.por.fl_str_mv |
SIMBA Sequenciamento NGS Montagem de genomas Webtool |
topic |
SIMBA Sequenciamento NGS Montagem de genomas Webtool Bioinformática |
dc.subject.other.pt_BR.fl_str_mv |
Bioinformática |
description |
A evolução das plataformas de sequenciamento em larga escala vem reduzindo o tempo gasto para o processo de decodificação do DNA a um custo reduzido. Porém, os sequenciadores possuem algumas limitações, como por exemplo, o tamanho máximo dos fragmentos de DNA que são capazes de ler. O que leva a necessidade de fragmentar o DNA em pequenos pedaços antes do sequenciamento, sendo necessário, após essa etapa, reordenar os fragmentos lidos (leituras) de forma que se possa representar o genoma original. Esse processo, conhecido como montagem de genomas, pode ser caracterizado pela sua complexidade e dependência pelas limitações dos sequenciadores, o que evidencia a necessidade do uso de diversos programas computacionais. Nos últimos anos, diversas estratégias para montagem de genomas foram propostas, mas ainda não existe um consenso sobre qual a melhor abordagem. Nesse contexto, propõe-se um pipeline para montagem de genomas bacterianos, que será gerenciado por uma aplicação Web com interface amigável denominada SIMBA (Simple Manager for Bacterial Assemblies). Para avaliar sua performance foram feitas as montagens das linhagens Corynebacterium pseudotuberculosis 1002 (originalmente sequenciada nas plataformas 454 Roche e Sanger) e Corynebacterium pseudotuberculosis 258 (originalmente sequenciada na plataforma SOLiD v3) através de cinco diferentes softwares: Mira3, Mira4, Minia, Newbler e SPAdes. Ambas as linhagens foram ressequenciadas com bibliotecas de fragmentos simples de tamanho aproximado a 200pb na plataforma de semicondutores Ion PGM. Após a montagem, escolheu-se um dos cinco resultados para etapa de fechamento de gaps através de duas abordagens: baseada em referência e baseada em mapeamento óptico. Por fim, observou-se que a ferramenta SIMBA permitiu uma rápida e fácil execução do processo de montagem e curadoria dos genomas. O download da ferramenta foi disponibilizado no website: <http://ufmg-simba.sourceforge.net>. |
publishDate |
2015 |
dc.date.issued.fl_str_mv |
2015-02-26 |
dc.date.accessioned.fl_str_mv |
2019-08-10T21:07:13Z |
dc.date.available.fl_str_mv |
2019-08-10T21:07:13Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/BUBD-A3QNAQ |
url |
http://hdl.handle.net/1843/BUBD-A3QNAQ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/1/disserta__o_v5.9_final.pdf https://repositorio.ufmg.br/bitstream/1843/BUBD-A3QNAQ/2/disserta__o_v5.9_final.pdf.txt |
bitstream.checksum.fl_str_mv |
cd5b3e6813aa647676a782ef54695297 ceb1e94cc814175a82e1864ba0b84cdb |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589553606361088 |