In silico characterization of microbial communities interaction in soil samples

Detalhes bibliográficos
Autor(a) principal: Gomes, Marta Lopes
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: https://hdl.handle.net/1822/79891
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_2e9aa9964d3ad55d47fc02a874c651c6
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/79891
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling In silico characterization of microbial communities interaction in soil samplesClusteringOrthologousHomologyAnnotationMicrobial communitiesFunctional potencialOrtólogosHomologiaAnotaçãoComunidades microbiaisPotencial funcionalCiências Naturais::Ciências da Computação e da InformaçãoDissertação de mestrado em BioinformáticaMlicrobial communities, besides its many applications, can represent a solution for pollution problems with reduced costs. However, to explore them in our favor, it is necessary to understand how they work and be able to infer their potential regarding specific metabolic networks. Because of the continuous growth of genomic data, various tools have been developed for homology and metabolic pathway inference, however new and improved strategies and algorithms still being required. In this work, it has been developed a pipeline that makes use of clusters of orthologous data to perform the annotation of unknown sequences, and after that, the prediction of species' functional potential and microbial interactions. For that were developed two tools, OrtScraper, for the download of bulk organized data from specif pathways of interest, and OrtAn that performs the annotation on clusters of orthologous groups. The test and evalua-tion of the pipeline were focused on the well-known transformation of benzoate to acetyl-CoA (BTA) pathway. Two different genome sets were used, set A, from whose the annotation of the sequences was known, and set B, from whose the capacity regarding the benzoate degradation was known. Both tools successfully performed the desired goal and for the annotation, the best cases presented an FL score over 0.90. The recall values of the annotation showed to be the weakest point of this pipeline, which led, possibly, to the unsatisfactory results on the prediction of the species functional potential. Some improvements to the developed tools and pipeline were proposed to improve the annotation and species functional potential inference.As comunidades microbianas, além das suas várias aplicações, podem representar uma solução, de custos reduzidos, para problemas de poluição. No entanto, para explorá-las a nosso favor, é necessário entender como funcionam e poder inferir seu potencial em relação a redes metabólicas específicas. Devido ao crescimento contínuo dos dados genómicos, várias ferramentas têm sido desenvolvidas para a inferência de homologia e de vias metabólicas, no entanto, estratégias e algoritmos novos e melhorados ainda são necessários. Neste trabalho, foi desenvolvida uma pipeline que faz uso de clusters de ortólogos para a realização de anotação de sequências desconhecidas e, posteriormente, a previsão do potencial funcional das espécies e previsão de interações microbianas. Para isso foram desenvolvidas duas ferramentas, o OrtScraper, para o download de dados em massa organizados pertencentes a vias metabólicas de interesse, e o OrtAn, que realiza a anotação a partir de clusters de ortólogos. O teste e a avaliação da pipeline foram focados na bem conhecida transformação do benzoato em acetilCoA (BTA). Foram utilizados dois conjuntos de genomas diferentes, o conjunto A, de onde se conhecia a anotação das sequências, e o conjunto B, de onde se conhecia a capacidade de degradação do benzoato. Ambas as ferramentas realizaram com sucesso o objetivo desejado e, para a anotação, os melhores casos apresentaram pontuação F1 acima de 0,90. Os valores de recai! da anotação mostraram-se o ponto mais fraco desta pipeline, o que levou, possivelmente, aos resultados insatisfatórios na previsão do potencial funcional das espécies. Foram propostas algumas melhorias nas ferramentas e pipeline desenvolvidas para melhorar a anotação e a inferência do potencial funcional das espécies.Dias, OscarRocha, Ulisses Nunes daUniversidade do MinhoGomes, Marta Lopes2019-12-132019-12-13T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/79891eng203017757info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-12-09T01:20:46Zoai:repositorium.sdum.uminho.pt:1822/79891Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:34:02.905077Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv In silico characterization of microbial communities interaction in soil samples
title In silico characterization of microbial communities interaction in soil samples
spellingShingle In silico characterization of microbial communities interaction in soil samples
Gomes, Marta Lopes
Clustering
Orthologous
Homology
Annotation
Microbial communities
Functional potencial
Ortólogos
Homologia
Anotação
Comunidades microbiais
Potencial funcional
Ciências Naturais::Ciências da Computação e da Informação
title_short In silico characterization of microbial communities interaction in soil samples
title_full In silico characterization of microbial communities interaction in soil samples
title_fullStr In silico characterization of microbial communities interaction in soil samples
title_full_unstemmed In silico characterization of microbial communities interaction in soil samples
title_sort In silico characterization of microbial communities interaction in soil samples
author Gomes, Marta Lopes
author_facet Gomes, Marta Lopes
author_role author
dc.contributor.none.fl_str_mv Dias, Oscar
Rocha, Ulisses Nunes da
Universidade do Minho
dc.contributor.author.fl_str_mv Gomes, Marta Lopes
dc.subject.por.fl_str_mv Clustering
Orthologous
Homology
Annotation
Microbial communities
Functional potencial
Ortólogos
Homologia
Anotação
Comunidades microbiais
Potencial funcional
Ciências Naturais::Ciências da Computação e da Informação
topic Clustering
Orthologous
Homology
Annotation
Microbial communities
Functional potencial
Ortólogos
Homologia
Anotação
Comunidades microbiais
Potencial funcional
Ciências Naturais::Ciências da Computação e da Informação
description Dissertação de mestrado em Bioinformática
publishDate 2019
dc.date.none.fl_str_mv 2019-12-13
2019-12-13T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/79891
url https://hdl.handle.net/1822/79891
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203017757
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132860648521728