A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/230686 |
Resumo: | As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O metabarcoding a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o grande desafio da garantia de qualidade e reprodutibilidade dos resultados. Pipelines de análise padronizadas são uma alternativa para essa questão, no entanto, o uso de parâmetros apropriados podem gerar impacto direto nos resultados obtidos. O objetivo deste trabalho foi, portanto, elucidara influência de parâmetros de análise nos resultados de análises de dados de 16S rDNA referentes à microbiota intestinal humana, utilizando como referência o pipeline do BMP - Brazilian Microbiome Project. Para isso foram comparados os resultados de diferentes combinações entre índices de confiabilidade, classificadores e pipelines para clusterização. Nossos resultados indicam diferenças claras entre a aplicação de diferentes parâmetros ao pipeline, gerando diferentes efeitos na quantidade de taxa identificados, de OTUs classificadas e na precisão da classificação. Resultados de combinações de classificadores e índices de confiança apresentam variações entre os dois pipelines de clusterização, no USEARCH havendo pouca diferenciação com a alteração dos classificadores e no VSEARCH apresentando maiores disparidades- com destaque para o Mothur, cujos resultados de número de taxa identificados e OTUs classificadas foram acima dos demais, não respondendo inclusive ao aumento do índice de confiança. Destacamos ainda o papel da remoção de sequências quiméricas na qualidade dos resultados. Com isso, salientamos a importância da inclusão em estudos de microbiota de detalhes dos parâmetros e métodos aplicados, garantindo a validação, qualidade e reprodutibilidade do resultado. Compreender os pipelines aplicados e os efeitos de seus parâmetros é essencial. Testar diferentes pipelines e variações dos parâmetros é recomendável. |
id |
UFRGS-2_73f62a5e71f6f8365152811e6bf33834 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/230686 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Coutinho, Laura BezerraMatte, Ursula da SilveiraLopes, Tiago Falcón2021-10-12T04:24:44Z2019http://hdl.handle.net/10183/230686001110449As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O metabarcoding a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o grande desafio da garantia de qualidade e reprodutibilidade dos resultados. Pipelines de análise padronizadas são uma alternativa para essa questão, no entanto, o uso de parâmetros apropriados podem gerar impacto direto nos resultados obtidos. O objetivo deste trabalho foi, portanto, elucidara influência de parâmetros de análise nos resultados de análises de dados de 16S rDNA referentes à microbiota intestinal humana, utilizando como referência o pipeline do BMP - Brazilian Microbiome Project. Para isso foram comparados os resultados de diferentes combinações entre índices de confiabilidade, classificadores e pipelines para clusterização. Nossos resultados indicam diferenças claras entre a aplicação de diferentes parâmetros ao pipeline, gerando diferentes efeitos na quantidade de taxa identificados, de OTUs classificadas e na precisão da classificação. Resultados de combinações de classificadores e índices de confiança apresentam variações entre os dois pipelines de clusterização, no USEARCH havendo pouca diferenciação com a alteração dos classificadores e no VSEARCH apresentando maiores disparidades- com destaque para o Mothur, cujos resultados de número de taxa identificados e OTUs classificadas foram acima dos demais, não respondendo inclusive ao aumento do índice de confiança. Destacamos ainda o papel da remoção de sequências quiméricas na qualidade dos resultados. Com isso, salientamos a importância da inclusão em estudos de microbiota de detalhes dos parâmetros e métodos aplicados, garantindo a validação, qualidade e reprodutibilidade do resultado. Compreender os pipelines aplicados e os efeitos de seus parâmetros é essencial. Testar diferentes pipelines e variações dos parâmetros é recomendável.The complex microbiological communities found in many environments - including the human body - are the microbiota. The comprehension of its composition and operation is target to great scientific interest, in view of the scale of its interactions and functions in which it is involved. Metabarcoding using 16S rDNA data is, today, a method widely applied to studies of microbiota composition. In this context, bioinformatic analysis of the data generated face the great challenge of guaranteeing the quality and reproducibility of results. Standardized analysis pipelines are alternatives to this problem, however, using appropriate parameters may have direct impact in the results obtained. Therefore, the objective of this work is to clarify the influence of the parameters in the results of analysis of 16S rDNA from human gut, using as reference the BMP - Brazilian Microbiome Project - pipeline, and comparing the results of different combinations between minimum confidences, classifiers and clustering pipelines. Our results point to visible differences between the application of different parameters to the pipeline, having diverse effects in the quantity of identified taxa, classified OTUs and the precision of the classification. The results of combinations of classifiers and minimum confidences present variation between the two clustering pipelines, USEARCH showing little differences after altering the classifiers and VSEARCH great disparities - specially Mothur, whose results of number of identified taxa and classified OTUs were always above the others, even not responding to the increase in the minimum confidence. We also highlight the importance of the removal of chimeric sequences to the quality of results. Thereby, we point the importance of inclusion in microbiota studies of details of parameters and methods applied, guaranteeing the validation, quality and reproducibility of the result. It is essential to understand the applied pipelines and their parameters. Testing different pipelines and variations of parameters is recommendable.application/pdfporMicrobiotaClusterA influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcodinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de BiociênciasPorto Alegre, BR-RS2019Biotecnologiagraduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001110449.pdf.txt001110449.pdf.txtExtracted Texttext/plain71341http://www.lume.ufrgs.br/bitstream/10183/230686/2/001110449.pdf.txt8b759e8c109c7541ff9d5ecde66921b1MD52ORIGINAL001110449.pdfTexto completoapplication/pdf1114517http://www.lume.ufrgs.br/bitstream/10183/230686/1/001110449.pdff2beea01b66275eab92f0ceacc302ca5MD5110183/2306862022-09-07 04:50:15.96563oai:www.lume.ufrgs.br:10183/230686Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2022-09-07T07:50:15Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding |
title |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding |
spellingShingle |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding Coutinho, Laura Bezerra Microbiota Cluster |
title_short |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding |
title_full |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding |
title_fullStr |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding |
title_full_unstemmed |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding |
title_sort |
A influência do índice de confiança, pipeline de clusterização e classificadores em análises de metabarcoding |
author |
Coutinho, Laura Bezerra |
author_facet |
Coutinho, Laura Bezerra |
author_role |
author |
dc.contributor.author.fl_str_mv |
Coutinho, Laura Bezerra |
dc.contributor.advisor1.fl_str_mv |
Matte, Ursula da Silveira |
dc.contributor.advisor-co1.fl_str_mv |
Lopes, Tiago Falcón |
contributor_str_mv |
Matte, Ursula da Silveira Lopes, Tiago Falcón |
dc.subject.por.fl_str_mv |
Microbiota Cluster |
topic |
Microbiota Cluster |
description |
As complexas comunidades microbiológicas presentes nos mais diversos ambientes inclusive o corpo humano - são o que chamamos de microbiota e a compreensão de sua composição e funcionamento é alvo de grande interesse científico, tendo em vista a gama de interações e funções nas quais ela está envolvida. O metabarcoding a partir do 16S rDNA é, hoje, um método amplamente aplicado em estudos de composição da microbiota. Nesse contexto, as análises bioinformáticas dos dados gerados enfrentam o grande desafio da garantia de qualidade e reprodutibilidade dos resultados. Pipelines de análise padronizadas são uma alternativa para essa questão, no entanto, o uso de parâmetros apropriados podem gerar impacto direto nos resultados obtidos. O objetivo deste trabalho foi, portanto, elucidara influência de parâmetros de análise nos resultados de análises de dados de 16S rDNA referentes à microbiota intestinal humana, utilizando como referência o pipeline do BMP - Brazilian Microbiome Project. Para isso foram comparados os resultados de diferentes combinações entre índices de confiabilidade, classificadores e pipelines para clusterização. Nossos resultados indicam diferenças claras entre a aplicação de diferentes parâmetros ao pipeline, gerando diferentes efeitos na quantidade de taxa identificados, de OTUs classificadas e na precisão da classificação. Resultados de combinações de classificadores e índices de confiança apresentam variações entre os dois pipelines de clusterização, no USEARCH havendo pouca diferenciação com a alteração dos classificadores e no VSEARCH apresentando maiores disparidades- com destaque para o Mothur, cujos resultados de número de taxa identificados e OTUs classificadas foram acima dos demais, não respondendo inclusive ao aumento do índice de confiança. Destacamos ainda o papel da remoção de sequências quiméricas na qualidade dos resultados. Com isso, salientamos a importância da inclusão em estudos de microbiota de detalhes dos parâmetros e métodos aplicados, garantindo a validação, qualidade e reprodutibilidade do resultado. Compreender os pipelines aplicados e os efeitos de seus parâmetros é essencial. Testar diferentes pipelines e variações dos parâmetros é recomendável. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019 |
dc.date.accessioned.fl_str_mv |
2021-10-12T04:24:44Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/230686 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001110449 |
url |
http://hdl.handle.net/10183/230686 |
identifier_str_mv |
001110449 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/230686/2/001110449.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/230686/1/001110449.pdf |
bitstream.checksum.fl_str_mv |
8b759e8c109c7541ff9d5ecde66921b1 f2beea01b66275eab92f0ceacc302ca5 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447283248922624 |