Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos

Detalhes bibliográficos
Autor(a) principal: Lemos, Leandro Nascimento
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-07012016-094306/
Resumo: Na última década tem sido possível reconstruir o genoma de bactérias e arquéias presentes em comunidades microbianas de ambientes naturais a partir de dados metagenômicos. Isso tem revolucionado nosso entendimento sobre a topologia da árvore da vida e a descoberta de novas capacidades metabólicas, bem como auxiliado na identificação mais acurada de genes de interesse industrial, visto que os dados estão mais completos e menos fragmentados. Com base neste contexto, o objetivo geral deste projeto foi reconstruir o genoma de bactérias ligadas a degradação de biomassa vegetal em comunidades microbianas da compostagem, focando em análises de diversidade de enzimas de Glicosil Hidrolases (GHs), a partir de dados de sequências metagenômicas gerados no projeto temático processo 11/50870-6. Para alcançar os nossos objetivos, foram desenvolvidos pipelines computacionais com softwares já disponíveis na literatura e foram utilizados dois conjuntos principais de dados de sequenciamento massivo (um conjunto de dados seriados que engloba inúmeros estágios do processamento da compostagem e um conjunto de dados do metagenoma de um consórcio microbiano celulolítico e termofílico construído a partir de amostras da compostagem). Foram reconstruídos 13 genomas (sete genomas em amostras dos dados seriados e seis genomas na amostra do consórcio microbiano), sendo identificado no mínimo quatro novas espécies. As análises baseadas em filogenômica indicam a presença de pelo menos uma nova classe dentro do filo Firmicutes, uma nova espécie da família Paenibacillaceae e a reconstrução pela primeira vez do genoma da espécie Bacillus thermozeamaize. Também foram identificadas 33 lacunas/ilhas metagenômicas (IMs). Essas regiões apresentaram genes diretamente ligados a biossíntese de polissacarídeos do envelope celular, pseudogenes e proteínas hipotéticas. Algumas dessas proteínas estão diretamente ligadas ao reconhecimento de bacteríofagos durante a fase de infecção viral. A presença de IMs também indica uma divergência entre as populações microbianas presentes na compostagem com a espécie de referência. Quanto ao potencial de degradação de biomassa vegetal, todos os microrganismos apresentam genes com potencial para degradação de material lignocelulolítico durante o processamento de diferentes estágios da compostagem, indicando a importância do papel funcional dessas bactérias na compostagem.
id USP_1fcc99a296b33b3f47f7fca7de7a1493
oai_identifier_str oai:teses.usp.br:tde-07012016-094306
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicosReconstruction and analysis of microbial genomes from composting metagenomic dataBioinformáticaBioinformaticsGenomas microbianosMetagenômicaMetagenomicsMicrobial genomesNa última década tem sido possível reconstruir o genoma de bactérias e arquéias presentes em comunidades microbianas de ambientes naturais a partir de dados metagenômicos. Isso tem revolucionado nosso entendimento sobre a topologia da árvore da vida e a descoberta de novas capacidades metabólicas, bem como auxiliado na identificação mais acurada de genes de interesse industrial, visto que os dados estão mais completos e menos fragmentados. Com base neste contexto, o objetivo geral deste projeto foi reconstruir o genoma de bactérias ligadas a degradação de biomassa vegetal em comunidades microbianas da compostagem, focando em análises de diversidade de enzimas de Glicosil Hidrolases (GHs), a partir de dados de sequências metagenômicas gerados no projeto temático processo 11/50870-6. Para alcançar os nossos objetivos, foram desenvolvidos pipelines computacionais com softwares já disponíveis na literatura e foram utilizados dois conjuntos principais de dados de sequenciamento massivo (um conjunto de dados seriados que engloba inúmeros estágios do processamento da compostagem e um conjunto de dados do metagenoma de um consórcio microbiano celulolítico e termofílico construído a partir de amostras da compostagem). Foram reconstruídos 13 genomas (sete genomas em amostras dos dados seriados e seis genomas na amostra do consórcio microbiano), sendo identificado no mínimo quatro novas espécies. As análises baseadas em filogenômica indicam a presença de pelo menos uma nova classe dentro do filo Firmicutes, uma nova espécie da família Paenibacillaceae e a reconstrução pela primeira vez do genoma da espécie Bacillus thermozeamaize. Também foram identificadas 33 lacunas/ilhas metagenômicas (IMs). Essas regiões apresentaram genes diretamente ligados a biossíntese de polissacarídeos do envelope celular, pseudogenes e proteínas hipotéticas. Algumas dessas proteínas estão diretamente ligadas ao reconhecimento de bacteríofagos durante a fase de infecção viral. A presença de IMs também indica uma divergência entre as populações microbianas presentes na compostagem com a espécie de referência. Quanto ao potencial de degradação de biomassa vegetal, todos os microrganismos apresentam genes com potencial para degradação de material lignocelulolítico durante o processamento de diferentes estágios da compostagem, indicando a importância do papel funcional dessas bactérias na compostagem.In the last decade it has been possible to reconstruct Bacteria and Archaea genomes that are in natural microbial communities from metagenomic samples. This has revolutionized our understanding of the topology of the tree of life and the discovery of new metabolic functions, as well as aided in more accurate identification of industrial bioprospecting genes, since the genomic data are more complete and less fragmented. Based on this background, the aim of this project was to reconstruct the bacterial genomes linked to plant biomass degradation in composting communities, focusing on diversity analysis of Glycosyl Hydrolases (GHs) from metagenomic sequence data generated in the Thematic Project (Process 11/50870-6). To achieve our objectives, computational pipelines have been developed (this pipelines were based on software already available in the literature) and we use these pipelines in two massive data sets generated by high-throughput sequencing (one data set of time series compost sample which includes several stages of the composting process and other data set from a cellu- lolytic and thermophilic microbial consortium). Thirteen genomes were reconstructed (seven genomes from time series metagenomic data and six genomes from microbial consortium). At least four new species have been identified, and the analyzes based on phylogenomic inferences indicate the presence of at least one new class of Firmicutes phylum, and a new Paenibacillaceae family and the reconstruction for the first time the Bacillus thermozeamaize genome. They also identified 33 gaps/metagenomic Islands (IMs). These gaps had genes directly linked to polysaccharide biosynthesis of the cell envelope, pseudogenes and hypothetical proteins. Some of these proteins are directly linked to the bacteriophage during the recognition phase of viral infection. The presence of gaps also indicates a divergence between microbial populations present in the compost with the reference genome. All microbial genomes reconstructed in this studyhave genes linked to lignocellulolytic potential degradation during the different stages of composting process, indicating the functional role this bactéria in this environment.Biblioteca Digitais de Teses e Dissertações da USPSetubal, João CarlosLemos, Leandro Nascimento2015-09-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-07012016-094306/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2017-09-04T21:06:17Zoai:teses.usp.br:tde-07012016-094306Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212017-09-04T21:06:17Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
Reconstruction and analysis of microbial genomes from composting metagenomic data
title Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
spellingShingle Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
Lemos, Leandro Nascimento
Bioinformática
Bioinformatics
Genomas microbianos
Metagenômica
Metagenomics
Microbial genomes
title_short Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
title_full Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
title_fullStr Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
title_full_unstemmed Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
title_sort Reconstrução e análise de genomas de bactérias de compostagem a partir de dados metagenômicos
author Lemos, Leandro Nascimento
author_facet Lemos, Leandro Nascimento
author_role author
dc.contributor.none.fl_str_mv Setubal, João Carlos
dc.contributor.author.fl_str_mv Lemos, Leandro Nascimento
dc.subject.por.fl_str_mv Bioinformática
Bioinformatics
Genomas microbianos
Metagenômica
Metagenomics
Microbial genomes
topic Bioinformática
Bioinformatics
Genomas microbianos
Metagenômica
Metagenomics
Microbial genomes
description Na última década tem sido possível reconstruir o genoma de bactérias e arquéias presentes em comunidades microbianas de ambientes naturais a partir de dados metagenômicos. Isso tem revolucionado nosso entendimento sobre a topologia da árvore da vida e a descoberta de novas capacidades metabólicas, bem como auxiliado na identificação mais acurada de genes de interesse industrial, visto que os dados estão mais completos e menos fragmentados. Com base neste contexto, o objetivo geral deste projeto foi reconstruir o genoma de bactérias ligadas a degradação de biomassa vegetal em comunidades microbianas da compostagem, focando em análises de diversidade de enzimas de Glicosil Hidrolases (GHs), a partir de dados de sequências metagenômicas gerados no projeto temático processo 11/50870-6. Para alcançar os nossos objetivos, foram desenvolvidos pipelines computacionais com softwares já disponíveis na literatura e foram utilizados dois conjuntos principais de dados de sequenciamento massivo (um conjunto de dados seriados que engloba inúmeros estágios do processamento da compostagem e um conjunto de dados do metagenoma de um consórcio microbiano celulolítico e termofílico construído a partir de amostras da compostagem). Foram reconstruídos 13 genomas (sete genomas em amostras dos dados seriados e seis genomas na amostra do consórcio microbiano), sendo identificado no mínimo quatro novas espécies. As análises baseadas em filogenômica indicam a presença de pelo menos uma nova classe dentro do filo Firmicutes, uma nova espécie da família Paenibacillaceae e a reconstrução pela primeira vez do genoma da espécie Bacillus thermozeamaize. Também foram identificadas 33 lacunas/ilhas metagenômicas (IMs). Essas regiões apresentaram genes diretamente ligados a biossíntese de polissacarídeos do envelope celular, pseudogenes e proteínas hipotéticas. Algumas dessas proteínas estão diretamente ligadas ao reconhecimento de bacteríofagos durante a fase de infecção viral. A presença de IMs também indica uma divergência entre as populações microbianas presentes na compostagem com a espécie de referência. Quanto ao potencial de degradação de biomassa vegetal, todos os microrganismos apresentam genes com potencial para degradação de material lignocelulolítico durante o processamento de diferentes estágios da compostagem, indicando a importância do papel funcional dessas bactérias na compostagem.
publishDate 2015
dc.date.none.fl_str_mv 2015-09-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/95/95131/tde-07012016-094306/
url http://www.teses.usp.br/teses/disponiveis/95/95131/tde-07012016-094306/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256737419100160