A metagenomic approach to identify and characterize wastewater populations

Detalhes bibliográficos
Autor(a) principal: Martins, Sara Patrícia Monteiro
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/56115
Resumo: Dissertação de mestrado em Bioinformatics
id RCAP_8b3a80a89f596592ae56e8e647b1f597
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/56115
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling A metagenomic approach to identify and characterize wastewater populationsWhole shotgun metagenomicNext-generation sequencingEffluent-treatment plantEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformaticsWater scarcity and pollution are two main ecological focus nowadays. Knowledge of wastewater composition, regarding microorganisms and pollutants, is of great importance to improve the capacities of the effluent treatment plants (ETP). Advances in Next-generation sequencing (NGS) methodologies allowed for faster, cheaper and more accurate study of microbial communities. Besides being an extremely powerful analysis resource, whole shotgun metagenomic analysis comprises many challenging aspects, regarding the processing and analysis. In the present work a shotgun metagenomic bioinformatics analysis was performed comprising three samples from common ETPs (CETP) and four samples from a petrochemical complex ETPs (wastewaters with low and high salts collected in two distinct timepoints). The samples were sequenced with Illumina® HiSeq, generating paired-end reads with 2x150bp length. The main goals of this project were to evaluate currently available tools, establish a customized bioinformatics pipeline and to extract relevant biological information from the sequenced datasets. There were generated simulated datasets representative of the target data, in order to evaluate the performance of the available bioinformatics tools. Datasets were generated with three coverage levels and were used to test pre-processing, assembly and taxonomic tools. The target datasets, both with and without coverage split, were then subjected to processing and analysis using the pre-defined pipeline. A preliminary functional study was also performed using MG-RAST and MGX. Results from the evaluation of the performance of the bioinformatics tools showed that different tools behave differently in distinct datasets. The pipeline was defined using BayesHammer and Fastq-mcf as pre-processing tools, SPAdes for assembly and MetaPhlAn v2.0 for the taxonomical analysis. The assembly results for the target datasets showed a higher contiguity for high coverage levels and a lower contiguity for low coverage levels, highlighting the differences in microorganisms’ abundance and diversity and its impact during analysis. Taxonomical composition suggests the presence of putative pathogenic and opportunistic microorganisms on two of the CETP datasets (A2 and AKR12). It also suggests a more hostile environment in petrochemical complex ETPs datasets, which is concordant with a higher abundance of defence mechanisms on this datasets. The present results must be accounted to the effluent treatment processes.A escassez de água e a poluição são dois dos principais problemas ecológicos atualmente. O conhecimento da composição das águas residuais, referente a microrganismos e poluentes, é de grande importância para melhorar as capacidades das estações de tratamento de águas residuais (ETAR). Os avanços nos métodos de sequenciação de nova geração permitiram o estudo mais rápido, barato e preciso de comunidades microbianas. Apesar de ser um meio de análise altamente poderoso, a análise metagenómica por whole shotgun compreende muitos aspetos desafiadores, no que respeita o processamento e a análise. No presente trabalho, uma análise bioinformática de dados metagenómicos de shotgun foi efetuada incluindo três amostras de ETARs comuns e quatro amostras de ETARs de um complexo petroquímico (águas residuais com baixos e altos teores de sais, colhidas em dois momentos distintos). As amostras foram sequenciadas com Illumina® HiSeq, gerando paired-end reads com comprimento igual a 2x150pb. Os principais objetivos deste projeto foram avaliar ferramentas disponíveis atualmente, estabelecer uma pipeline bioinformática personalizada e extrair informação biológica relevante dos datasets sequenciados. Foram gerados datasets simulados representativos dos dados a analisar, de forma a avaliar a performance das ferramentas bioinformáticas disponíveis. Os datasets foram gerados com três níveis de coverage e foram usados para testar ferramentas de pré-processamento, assembly e taxonomia. Os datasets alvo, com e sem divisão por coverage, foram então sujeitos a processamento e análise usando a pipeline pré-definida. Um estudo funcional preliminar foi realizado com MG-RAST e MGX. Os resultados da avaliação da performance das ferramentas bioinformáticas mostraram que diferentes ferramentas comportam-se de forma diferente em datasets distintos. A pipeline foi definida usando BayesHammer e Fastq-mcf como ferramentas de pré-processamento, SPAdes para assembly e MetaPhlAn v2.0 para a análise taxonómica. Os resultados de assembly para os datasets alvo mostraram uma grande contiguidade para altos níveis de coverage e baixa contiguidade para baixos níveis de coverage, realçando as diferenças de abundância e diversidade dos microrganismos e o seu impacto durante a análise. A composição taxonómica sugere a presença de microrganismos potencialmente patogénicos e oportunistas nos dois datasets de ETARs comuns (A2 e AKR12). Sugere também um ambiente mais hostil nos datasets das ETARs do complexo petroquímico, o que é concordante com uma maior abundância de mecanismos de defesa nestes datasets. Os presentes resultados devem ser tidos em conta nos processos de tratamento de águas residuais. Palavras-chave: metagenómica de whole shotgun, sequenciação de nova geração, estação de tratamento de águas residuais.Santos, P. M.Universidade do MinhoMartins, Sara Patrícia Monteiro20172017-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/56115eng201971089info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-05-11T05:45:39Zoai:repositorium.sdum.uminho.pt:1822/56115Portal AgregadorONGhttps://www.rcaap.pt/oai/openairemluisa.alvim@gmail.comopendoar:71602024-05-11T05:45:39Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv A metagenomic approach to identify and characterize wastewater populations
title A metagenomic approach to identify and characterize wastewater populations
spellingShingle A metagenomic approach to identify and characterize wastewater populations
Martins, Sara Patrícia Monteiro
Whole shotgun metagenomic
Next-generation sequencing
Effluent-treatment plant
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short A metagenomic approach to identify and characterize wastewater populations
title_full A metagenomic approach to identify and characterize wastewater populations
title_fullStr A metagenomic approach to identify and characterize wastewater populations
title_full_unstemmed A metagenomic approach to identify and characterize wastewater populations
title_sort A metagenomic approach to identify and characterize wastewater populations
author Martins, Sara Patrícia Monteiro
author_facet Martins, Sara Patrícia Monteiro
author_role author
dc.contributor.none.fl_str_mv Santos, P. M.
Universidade do Minho
dc.contributor.author.fl_str_mv Martins, Sara Patrícia Monteiro
dc.subject.por.fl_str_mv Whole shotgun metagenomic
Next-generation sequencing
Effluent-treatment plant
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Whole shotgun metagenomic
Next-generation sequencing
Effluent-treatment plant
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Bioinformatics
publishDate 2017
dc.date.none.fl_str_mv 2017
2017-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/56115
url https://hdl.handle.net/1822/56115
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 201971089
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv mluisa.alvim@gmail.com
_version_ 1817544729853689856