A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding

Detalhes bibliográficos
Autor(a) principal: Coutinho, Laura Bezerra
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/230686
Resumo: As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O​ metabarcoding ​ a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o grande desafio da garantia de qualidade e reprodutibilidade dos resultados. ​Pipelines ​ de análise padronizadas são uma alternativa para essa questão, no entanto, o uso de parâmetros apropriados podem gerar impacto direto nos resultados obtidos. O objetivo deste trabalho foi, portanto, elucidara influência de parâmetros de análise nos resultados de análises de dados de 16S rDNA referentes à microbiota intestinal humana, utilizando como referência o ​pipeline ​ do BMP - Brazilian Microbiome Project. Para isso foram comparados os resultados de diferentes combinações entre índices de confiabilidade, classificadores e ​pipelines ​ para clusterização. Nossos resultados indicam diferenças claras entre a aplicação de diferentes parâmetros ao pipeline, gerando diferentes efeitos na quantidade de taxa identificados, de OTUs classificadas e na precisão da classificação. Resultados de combinações de classificadores e índices de confiança apresentam variações entre os dois ​pipelines de clusterização, no USEARCH havendo pouca diferenciação com a alteração dos classificadores e no VSEARCH apresentando maiores disparidades- com destaque para o Mothur, cujos resultados de número de taxa identificados e OTUs classificadas foram acima dos demais, não respondendo inclusive ao aumento do índice de confiança. Destacamos ainda o papel da remoção de sequências quiméricas na qualidade dos resultados. Com isso, salientamos a importância da inclusão em estudos de microbiota de detalhes dos parâmetros e métodos aplicados, garantindo a validação, qualidade e reprodutibilidade do resultado. Compreender os​ pipelines aplicados e os efeitos de seus parâmetros é essencial. Testar diferentes​ pipelines e variações dos parâmetros é recomendável.
id UFRGS-2_73f62a5e71f6f8365152811e6bf33834
oai_identifier_str oai:www.lume.ufrgs.br:10183/230686
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Coutinho, Laura BezerraMatte, Ursula da SilveiraLopes, Tiago Falcón2021-10-12T04:24:44Z2019http://hdl.handle.net/10183/230686001110449As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O​ metabarcoding ​ a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o grande desafio da garantia de qualidade e reprodutibilidade dos resultados. ​Pipelines ​ de análise padronizadas são uma alternativa para essa questão, no entanto, o uso de parâmetros apropriados podem gerar impacto direto nos resultados obtidos. O objetivo deste trabalho foi, portanto, elucidara influência de parâmetros de análise nos resultados de análises de dados de 16S rDNA referentes à microbiota intestinal humana, utilizando como referência o ​pipeline ​ do BMP - Brazilian Microbiome Project. Para isso foram comparados os resultados de diferentes combinações entre índices de confiabilidade, classificadores e ​pipelines ​ para clusterização. Nossos resultados indicam diferenças claras entre a aplicação de diferentes parâmetros ao pipeline, gerando diferentes efeitos na quantidade de taxa identificados, de OTUs classificadas e na precisão da classificação. Resultados de combinações de classificadores e índices de confiança apresentam variações entre os dois ​pipelines de clusterização, no USEARCH havendo pouca diferenciação com a alteração dos classificadores e no VSEARCH apresentando maiores disparidades- com destaque para o Mothur, cujos resultados de número de taxa identificados e OTUs classificadas foram acima dos demais, não respondendo inclusive ao aumento do índice de confiança. Destacamos ainda o papel da remoção de sequências quiméricas na qualidade dos resultados. Com isso, salientamos a importância da inclusão em estudos de microbiota de detalhes dos parâmetros e métodos aplicados, garantindo a validação, qualidade e reprodutibilidade do resultado. Compreender os​ pipelines aplicados e os efeitos de seus parâmetros é essencial. Testar diferentes​ pipelines e variações dos parâmetros é recomendável.The complex microbiological communities found in many environments - including the human body - are the microbiota. The comprehension of its composition and operation is target to great scientific interest, in view of the scale of its interactions and functions in which it is involved. Metabarcoding using 16S rDNA data is, today, a method widely applied to studies of microbiota composition. In this context, bioinformatic analysis of the data generated face the great challenge of guaranteeing the quality and reproducibility of results. Standardized analysis pipelines are alternatives to this problem, however, using appropriate parameters may have direct impact in the results obtained. Therefore, the objective of this work is to clarify the influence of the parameters in the results of analysis of 16S rDNA from human gut, using as reference the BMP - Brazilian Microbiome Project - pipeline, and comparing the results of different combinations between minimum confidences, classifiers and clustering pipelines. Our results point to visible differences between the application of different parameters to the pipeline, having diverse effects in the quantity of identified taxa, classified OTUs and the precision of the classification. The results of combinations of classifiers and minimum confidences present variation between the two clustering pipelines, USEARCH showing little differences after altering the classifiers and VSEARCH great disparities - specially Mothur, whose results of number of identified taxa and classified OTUs were always above the others, even not responding to the increase in the minimum confidence. We also highlight the importance of the removal of chimeric sequences to the quality of results. Thereby, we point the importance of inclusion in microbiota studies of details of parameters and methods applied, guaranteeing the validation, quality and reproducibility of the result. It is essential to understand the applied pipelines and their parameters. Testing different pipelines and variations of parameters is recommendable.application/pdfporMicrobiotaClusterA influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcodinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de BiociênciasPorto Alegre, BR-RS2019Biotecnologiagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001110449.pdf.txt001110449.pdf.txtExtracted Texttext/plain71341http://www.lume.ufrgs.br/bitstream/10183/230686/2/001110449.pdf.txt8b759e8c109c7541ff9d5ecde66921b1MD52ORIGINAL001110449.pdfTexto completoapplication/pdf1114517http://www.lume.ufrgs.br/bitstream/10183/230686/1/001110449.pdff2beea01b66275eab92f0ceacc302ca5MD5110183/2306862022-09-07 04:50:15.96563oai:www.lume.ufrgs.br:10183/230686Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-09-07T07:50:15Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
title A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
spellingShingle A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
Coutinho, Laura Bezerra
Microbiota
Cluster
title_short A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
title_full A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
title_fullStr A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
title_full_unstemmed A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
title_sort A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
author Coutinho, Laura Bezerra
author_facet Coutinho, Laura Bezerra
author_role author
dc.contributor.author.fl_str_mv Coutinho, Laura Bezerra
dc.contributor.advisor1.fl_str_mv Matte, Ursula da Silveira
dc.contributor.advisor-co1.fl_str_mv Lopes, Tiago Falcón
contributor_str_mv Matte, Ursula da Silveira
Lopes, Tiago Falcón
dc.subject.por.fl_str_mv Microbiota
Cluster
topic Microbiota
Cluster
description As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O​ metabarcoding ​ a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o grande desafio da garantia de qualidade e reprodutibilidade dos resultados. ​Pipelines ​ de análise padronizadas são uma alternativa para essa questão, no entanto, o uso de parâmetros apropriados podem gerar impacto direto nos resultados obtidos. O objetivo deste trabalho foi, portanto, elucidara influência de parâmetros de análise nos resultados de análises de dados de 16S rDNA referentes à microbiota intestinal humana, utilizando como referência o ​pipeline ​ do BMP - Brazilian Microbiome Project. Para isso foram comparados os resultados de diferentes combinações entre índices de confiabilidade, classificadores e ​pipelines ​ para clusterização. Nossos resultados indicam diferenças claras entre a aplicação de diferentes parâmetros ao pipeline, gerando diferentes efeitos na quantidade de taxa identificados, de OTUs classificadas e na precisão da classificação. Resultados de combinações de classificadores e índices de confiança apresentam variações entre os dois ​pipelines de clusterização, no USEARCH havendo pouca diferenciação com a alteração dos classificadores e no VSEARCH apresentando maiores disparidades- com destaque para o Mothur, cujos resultados de número de taxa identificados e OTUs classificadas foram acima dos demais, não respondendo inclusive ao aumento do índice de confiança. Destacamos ainda o papel da remoção de sequências quiméricas na qualidade dos resultados. Com isso, salientamos a importância da inclusão em estudos de microbiota de detalhes dos parâmetros e métodos aplicados, garantindo a validação, qualidade e reprodutibilidade do resultado. Compreender os​ pipelines aplicados e os efeitos de seus parâmetros é essencial. Testar diferentes​ pipelines e variações dos parâmetros é recomendável.
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2021-10-12T04:24:44Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/230686
dc.identifier.nrb.pt_BR.fl_str_mv 001110449
url http://hdl.handle.net/10183/230686
identifier_str_mv 001110449
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/230686/2/001110449.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/230686/1/001110449.pdf
bitstream.checksum.fl_str_mv 8b759e8c109c7541ff9d5ecde66921b1
f2beea01b66275eab92f0ceacc302ca5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1815447283248922624