MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens

Detalhes bibliográficos
Autor(a) principal: Sanchez, Fabio Beltrame
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-16092021-090947/
Resumo: Um MAG (metagenome-assembled genome) é um genoma recuperado de dados metagenômicos e neste trabalho referem-se sempre a genomas de organismos procariotos. Após a obtenção de um MAG, diversas análises podem ser feitas para identificar similaridades e diferenças com os genomas já publicados da mesma espécie (quando a espécie é conhecida). Apresentamos MAGset, um software para comparar genomas e identificar especificidades em MAGs de espécies conhecidas. Essas especificidades podem ser regiões genômicas que existem somente no MAG e não existem nos genomas de referência, ou regiões que existem em um ou mais genomas de referência e não existem no MAG. Neste último caso, o módulo acessório MAGcheck permite verificar se as regiões não encontradas no MAG estão disponíveis nas amostras (reads) utilizadas na montagem do MAG, indicando um possível erro na montagem. Feita a comparação entre os genomas de interesse de forma automática pelo software, os seguintes resultados são apresentados ao usuário por meio de uma interface gráfica amigável: Matriz ANI comparando todos os genomas, pangenoma, anotações dos genes codificadores de proteína com os bancos CAZy e COG, regiões genômicas de interesse e resultado da validação do MAGcheck contra as amostras. Utilizando MAGset e MAGcheck, apresentamos os resultados de análises de 36 MAGs obtidos de diversas fontes. Os resultados obtidos com MAGcheck (obtivemos resultados em 34 MAGs) foram utilizados para realizar a remontagem dos MAGs originais, gerando melhorias na completude (24 dos 34 MAGs remontados) e no tamanho final (todos os MAGs remontados tiveram seu tamanho aumentado).
id USP_73cf4ff106fe7b129062fc48afe87e38
oai_identifier_str oai:teses.usp.br:tde-16092021-090947
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagensMAGset: a tool for comparing metagenome-assembled genomes and its application to improve their assemblyComparative genomicsGenome assemblyGenômica comparativaMAGMAGMetagenômicaMetagenomicsMontagem de genomasUm MAG (metagenome-assembled genome) é um genoma recuperado de dados metagenômicos e neste trabalho referem-se sempre a genomas de organismos procariotos. Após a obtenção de um MAG, diversas análises podem ser feitas para identificar similaridades e diferenças com os genomas já publicados da mesma espécie (quando a espécie é conhecida). Apresentamos MAGset, um software para comparar genomas e identificar especificidades em MAGs de espécies conhecidas. Essas especificidades podem ser regiões genômicas que existem somente no MAG e não existem nos genomas de referência, ou regiões que existem em um ou mais genomas de referência e não existem no MAG. Neste último caso, o módulo acessório MAGcheck permite verificar se as regiões não encontradas no MAG estão disponíveis nas amostras (reads) utilizadas na montagem do MAG, indicando um possível erro na montagem. Feita a comparação entre os genomas de interesse de forma automática pelo software, os seguintes resultados são apresentados ao usuário por meio de uma interface gráfica amigável: Matriz ANI comparando todos os genomas, pangenoma, anotações dos genes codificadores de proteína com os bancos CAZy e COG, regiões genômicas de interesse e resultado da validação do MAGcheck contra as amostras. Utilizando MAGset e MAGcheck, apresentamos os resultados de análises de 36 MAGs obtidos de diversas fontes. Os resultados obtidos com MAGcheck (obtivemos resultados em 34 MAGs) foram utilizados para realizar a remontagem dos MAGs originais, gerando melhorias na completude (24 dos 34 MAGs remontados) e no tamanho final (todos os MAGs remontados tiveram seu tamanho aumentado).A metagenome-assembled genome (MAG) is a genome reconstructed from metagenomic data, and in this work, MAGs refers to genomes of prokaryotic organisms. After obtaining a MAG, several analyses can be performed to identify similarities and differences with already published genomes from the same species (when the species is known). MAGset is a software to compare genomes and identify specificities in MAGs of known species. These specificities can be genomic regions that exist only in the MAG but not in reference genomes, or regions that exist in one or more reference genomes but do not exist in the MAG. In the latter case, the MAGcheck accessory module verifies whether the regions not found in the MAG are available in the samples (reads) used in the MAG assembly, indicating data missed by the assembler or binning program. Once the software has automatically compared the genomes of interest, the following results are presented to the user via a user-friendly graphical interface: ANI matrix comparing all genomes, pangenome information, annotations of protein-coding genes with CAZy and COG databases, genomic regions of interest, and the results of the MAGcheck validation against the samples. Using MAGset and MAGcheck, we present the results of analyses of 36 MAGs obtained from a variety of sources. The results obtained with MAGcheck (we obtained results for 34 MAGs) were used to perform the reassembly of the original MAGs, generating improvements in completeness (24 of the 34 MAGs reassembled) and in the final size (all reassembled MAGs increased in size).Biblioteca Digitais de Teses e Dissertações da USPSetubal, João CarlosSanchez, Fabio Beltrame2021-09-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/95/95131/tde-16092021-090947/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-03-15T21:30:02Zoai:teses.usp.br:tde-16092021-090947Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-03-15T21:30:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
MAGset: a tool for comparing metagenome-assembled genomes and its application to improve their assembly
title MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
spellingShingle MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
Sanchez, Fabio Beltrame
Comparative genomics
Genome assembly
Genômica comparativa
MAG
MAG
Metagenômica
Metagenomics
Montagem de genomas
title_short MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
title_full MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
title_fullStr MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
title_full_unstemmed MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
title_sort MAGset: uma ferramenta para comparação de genomas recuperados de dados metagenômicos e sua aplicação para melhoria de suas montagens
author Sanchez, Fabio Beltrame
author_facet Sanchez, Fabio Beltrame
author_role author
dc.contributor.none.fl_str_mv Setubal, João Carlos
dc.contributor.author.fl_str_mv Sanchez, Fabio Beltrame
dc.subject.por.fl_str_mv Comparative genomics
Genome assembly
Genômica comparativa
MAG
MAG
Metagenômica
Metagenomics
Montagem de genomas
topic Comparative genomics
Genome assembly
Genômica comparativa
MAG
MAG
Metagenômica
Metagenomics
Montagem de genomas
description Um MAG (metagenome-assembled genome) é um genoma recuperado de dados metagenômicos e neste trabalho referem-se sempre a genomas de organismos procariotos. Após a obtenção de um MAG, diversas análises podem ser feitas para identificar similaridades e diferenças com os genomas já publicados da mesma espécie (quando a espécie é conhecida). Apresentamos MAGset, um software para comparar genomas e identificar especificidades em MAGs de espécies conhecidas. Essas especificidades podem ser regiões genômicas que existem somente no MAG e não existem nos genomas de referência, ou regiões que existem em um ou mais genomas de referência e não existem no MAG. Neste último caso, o módulo acessório MAGcheck permite verificar se as regiões não encontradas no MAG estão disponíveis nas amostras (reads) utilizadas na montagem do MAG, indicando um possível erro na montagem. Feita a comparação entre os genomas de interesse de forma automática pelo software, os seguintes resultados são apresentados ao usuário por meio de uma interface gráfica amigável: Matriz ANI comparando todos os genomas, pangenoma, anotações dos genes codificadores de proteína com os bancos CAZy e COG, regiões genômicas de interesse e resultado da validação do MAGcheck contra as amostras. Utilizando MAGset e MAGcheck, apresentamos os resultados de análises de 36 MAGs obtidos de diversas fontes. Os resultados obtidos com MAGcheck (obtivemos resultados em 34 MAGs) foram utilizados para realizar a remontagem dos MAGs originais, gerando melhorias na completude (24 dos 34 MAGs remontados) e no tamanho final (todos os MAGs remontados tiveram seu tamanho aumentado).
publishDate 2021
dc.date.none.fl_str_mv 2021-09-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/95/95131/tde-16092021-090947/
url https://www.teses.usp.br/teses/disponiveis/95/95131/tde-16092021-090947/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257079908139008