Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos

Detalhes bibliográficos
Autor(a) principal: Leal, Jaime Nunes
Data de Publicação: 2020
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/218001
Resumo: TCC(graduação) - Universidade Federal de Santa Catarina. Centro de Ciências Biológicas. Biologia.
id UFSC_1acc06fe0bdf6244571b4c48f02b0f0b
oai_identifier_str oai:repositorio.ufsc.br:123456789/218001
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa CatarinaLeal, Jaime NunesWagner, GlauberKawagoe, Eric Kazuo2020-12-02T20:14:24Z2020-12-02T20:14:24Z2020-11-18https://repositorio.ufsc.br/handle/123456789/218001TCC(graduação) - Universidade Federal de Santa Catarina. Centro de Ciências Biológicas. Biologia.Os bacteriófagos, comumente chamados de fagos, são vírus intracelulares obrigatórios capazes de infectar arqueas e bactérias. A interação entra bacteriófago e bactérias podem levar a morte bacteriana e com isso impactar na comunidade microbiana interferindo nos ciclos ambientais e nos setores industriais nos quais estes microrganismos então envolvidos. Esse trabalho teve como objetivo analisar a variação entre os resultados de predição de bacteriófagos ambientais utilizando diferentes programas de predição viral. Para tal, utilizamos sequências de 927 genomas completos, obtidos do NCBI/GenBank, os quais foram utilizados para uma simulação de montagem de sequenciamento metagenômico através do programa ART, compondo um grupo controle. Para testes em amostras reais, utilizamos dados brutos de amostras metagenomas ambientais de Ganzi (China), Mar Mediterrâneo (Europa) e Santa Mônica (EUA) depositados no do NCBI/SRA. Os dados brutos passaram por uma etapa de controle de qualidade e montagem metagenômica pelos programas Trimmomatic e metaSPAdes, respectivamente. Predições de bacteriófagos para as montagens foram realizadas pelos programas VirFinder, VirSorter e MARVEL. Dos 927 bacteriófagos utilizados na montagem da amostra controle, o VirFinder encontrou 633 fagos (68%) em menos de uma hora de processamento, o ViSorter identificou 530 fagos (57%) em cerca de dez horas de análise e o MARVEL retornou 432 fagos (47%) em nove horas de processamento. Para as amostras ambientais, os programas foram capazes de identificar bacteriófagos apenas na amostra do Mar Mediterrâneo. O VirFinder identificou oito fagos, sendo sete destes da família Siphoviridae classificados como bacteriófagos não cultivados do Mar Mediterrâneo e um referente à família Microviridae. O VirSorter identificou apenas um bacteriófago da família Microviridae, enquanto o MARVEL identificou sete bacteriófagos, todos da família Siphoviridae classificados como não cultivados do Mediterrâneo. Os programas VirFinder e MARVEL identificaram quatro bacteriófagos exclusivos, não identificados por nenhum outro programa. Considerando o tempo de desempenho e a diversidade de fagos identificados, o programa VirFinder obteve o melhor resultado para as amostras analisadas. Nota-se que apenas a amostra do Mar Mediterrâneo faz parte de um estudo sobre o viroma, enquanto as demais são amostras de metagenoma global, o que demonstra que as etapas anteriores ao sequenciamento como construção de biblioteca e preparação de amostras, são essenciais para uma melhor identificação de bacteriófagos em amostras ambientais. Apesar de o VirFinder ter apresentado melhor desempenho, não podemos descartar o uso dos demais programas, em razão da identificação de fagos exclusivos por estes programas, sendo assim os programas estes podem ser utilizados de forma complementar para uma melhor interpretação da diversidade da amostra, além disso o preparo da amostra se demonstrou fundamental para capacidade de identificação de bacteriófagos ambientais.Bacteriophages, commonly known as phages, are mandatory intracellular viruses able to infect archaea and bacteria. Phage-host interaction can impact different areas, such as pharmaceutical sectors, the food industry and biogeochemical cycles. This study aimed to analyse viral prediction results from three different softwares and their accuracy for environmental bacteriophage prediction. For the control sample, a total of 927 complete bacteriophage genomes obtained from NCBI/GenBank were concatenated and used to simulate raw data through the programa ART. Raw data for environmental samples were obtained from NCBI/SRA and corresponded to samples from Ganzi (China), Mediterranean Sea and Santa Monica (USA). Raw data were preprocessed and assembled with Trimmomatic and metaSPAdes, respectively. Bacteriophage prediction was performed by VirFinder, VirSorter and MARVEL. VirFinder identified 633 phages (68%) in less than one hour of processing, VirSorter identified 530 (57%) in around ten hours of analyse and MARVEL identified 432 (47%) in nine hours of processing from the 927 bacteriophages used in the control sample. The three prediction programas were able to identify bacteriophages only in the Mediterranean Sea sample. VirFinder identified eight phages, seven of which belonged to the Siphoviridae family and were classified as Uncultured Mediterranean Sea phages, and one of the Microviridae family. VirSorter identified only one bacteriophage of the Microviridae family. MARVEL identified seven bacteriophages, all from the Siphoviridae family and classified as Uncultured Mediterranean Sea phages. Both VirFinder and MARVEL identified four exclusive bacteriophages, which were not found by VirSorter. VirFinder presented the best performance regarding processing time and organism identification in all analysed samples. The sample of Mediterranean Sea is part of a virome study, while the others samples are from global metagenome, this shows that steps pre processing are essential for a more accurate identification. Although VirFinder had shown best performance, we cannot discard the use of other softwares, because there are exclusive phage identification with this programas, therefore the softwares can be used in complementary ways for better interpretations related to sample diversity.54 f.Florianópolis, SC.BioinformáticaMetagenômicaPrediçãoVírusComparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCLICENSElicense.txtlicense.txttext/plain; charset=utf-81383https://repositorio.ufsc.br/bitstream/123456789/218001/2/license.txt11ee89cd31d893362820eab7c4d46734MD52ORIGINALTCC.pdfTCC.pdfTCCapplication/pdf1139365https://repositorio.ufsc.br/bitstream/123456789/218001/1/TCC.pdf7c9713129eaa1221207fe68f483a7691MD51123456789/2180012020-12-02 17:14:26.843oai:repositorio.ufsc.br:123456789/218001Vm9jw6ogdGVtIGEgbGliZXJkYWRlIGRlOiBDb21wYXJ0aWxoYXIg4oCUIGNvcGlhciwgZGlzdHJpYnVpciBlIHRyYW5zbWl0aXIgYSBvYnJhLiBSZW1peGFyIOKAlCBjcmlhciBvYnJhcyBkZXJpdmFkYXMuClNvYiBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6IEF0cmlidWnDp8OjbyDigJQgVm9jw6ogZGV2ZSBjcmVkaXRhciBhIG9icmEgZGEgZm9ybWEgZXNwZWNpZmljYWRhIHBlbG8gYXV0b3Igb3UgbGljZW5jaWFudGUgKG1hcyBuw6NvIGRlIG1hbmVpcmEgcXVlIHN1Z2lyYSBxdWUgZXN0ZXMgY29uY2VkZW0gcXVhbHF1ZXIgYXZhbCBhIHZvY8OqIG91IGFvIHNldSB1c28gZGEgb2JyYSkuIFVzbyBuw6NvLWNvbWVyY2lhbCDigJQgVm9jw6ogbsOjbyBwb2RlIHVzYXIgZXN0YSBvYnJhIHBhcmEgZmlucyBjb21lcmNpYWlzLgpGaWNhbmRvIGNsYXJvIHF1ZTogUmVuw7puY2lhIOKAlCBRdWFscXVlciBkYXMgY29uZGnDp8O1ZXMgYWNpbWEgcG9kZSBzZXIgcmVudW5jaWFkYSBzZSB2b2PDqiBvYnRpdmVyIHBlcm1pc3PDo28gZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMuIERvbcOtbmlvIFDDumJsaWNvIOKAlCBPbmRlIGEgb2JyYSBvdSBxdWFscXVlciBkZSBzZXVzIGVsZW1lbnRvcyBlc3RpdmVyIGVtIGRvbcOtbmlvIHDDumJsaWNvIHNvYiBvIGRpcmVpdG8gYXBsaWPDoXZlbCwgZXN0YSBjb25kacOnw6NvIG7Do28gw6ksIGRlIG1hbmVpcmEgYWxndW1hLCBhZmV0YWRhIHBlbGEgbGljZW7Dp2EuIE91dHJvcyBEaXJlaXRvcyDigJQgT3Mgc2VndWludGVzIGRpcmVpdG9zIG7Do28gc8OjbywgZGUgbWFuZWlyYSBhbGd1bWEsIGFmZXRhZG9zIHBlbGEgbGljZW7Dp2E6IExpbWl0YcOnw7VlcyBlIGV4Y2XDp8O1ZXMgYW9zIGRpcmVpdG9zIGF1dG9yYWlzIG91IHF1YWlzcXVlciB1c29zIGxpdnJlcyBhcGxpY8OhdmVpczsgT3MgZGlyZWl0b3MgbW9yYWlzIGRvIGF1dG9yOyBEaXJlaXRvcyBxdWUgb3V0cmFzIHBlc3NvYXMgcG9kZW0gdGVyIHNvYnJlIGEgb2JyYSBvdSBzb2JyZSBhIHV0aWxpemHDp8OjbyBkYSBvYnJhLCB0YWlzIGNvbW8gZGlyZWl0b3MgZGUgaW1hZ2VtIG91IHByaXZhY2lkYWRlLiBBdmlzbyDigJQgUGFyYSBxdWFscXVlciByZXV0aWxpemHDp8OjbyBvdSBkaXN0cmlidWnDp8Ojbywgdm9jw6ogZGV2ZSBkZWl4YXIgY2xhcm8gYSB0ZXJjZWlyb3Mgb3MgdGVybW9zIGRhIGxpY2Vuw6dhIGEgcXVlIHNlIGVuY29udHJhIHN1Ym1ldGlkYSBlc3RhIG9icmEuIEEgbWVsaG9yIG1hbmVpcmEgZGUgZmF6ZXIgaXNzbyDDqSBjb20gdW0gbGluayBwYXJhIGVzdGEgcMOhZ2luYS4KTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyAtIGh0dHA6Ly9jcmVhdGl2ZWNvbW1vbnMub3JnL2xpY2Vuc2VzL2J5LW5jLzMuMC9ici8KRepositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732020-12-02T20:14:26Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.pt_BR.fl_str_mv Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
title Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
spellingShingle Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
Leal, Jaime Nunes
Bioinformática
Metagenômica
Predição
Vírus
title_short Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
title_full Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
title_fullStr Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
title_full_unstemmed Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
title_sort Comparação entre os programas MARVEL, VirFinder e VirSorter quanto a identificação de bacteriófagos a partir de dados metagenômicos
author Leal, Jaime Nunes
author_facet Leal, Jaime Nunes
author_role author
dc.contributor.pt_BR.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Leal, Jaime Nunes
dc.contributor.advisor1.fl_str_mv Wagner, Glauber
dc.contributor.advisor-co1.fl_str_mv Kawagoe, Eric Kazuo
contributor_str_mv Wagner, Glauber
Kawagoe, Eric Kazuo
dc.subject.por.fl_str_mv Bioinformática
Metagenômica
Predição
Vírus
topic Bioinformática
Metagenômica
Predição
Vírus
description TCC(graduação) - Universidade Federal de Santa Catarina. Centro de Ciências Biológicas. Biologia.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-12-02T20:14:24Z
dc.date.available.fl_str_mv 2020-12-02T20:14:24Z
dc.date.issued.fl_str_mv 2020-11-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/218001
url https://repositorio.ufsc.br/handle/123456789/218001
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 54 f.
dc.publisher.none.fl_str_mv Florianópolis, SC.
publisher.none.fl_str_mv Florianópolis, SC.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/218001/2/license.txt
https://repositorio.ufsc.br/bitstream/123456789/218001/1/TCC.pdf
bitstream.checksum.fl_str_mv 11ee89cd31d893362820eab7c4d46734
7c9713129eaa1221207fe68f483a7691
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766804934498451456