Automation tool for taxonomic classification in the family Geminiviridae

Detalhes bibliográficos
Autor(a) principal: Gomes, Ruither Arthur Loch
Data de Publicação: 2018
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: LOCUS Repositório Institucional da UFV
Texto Completo: http://www.locus.ufv.br/handle/123456789/25202
Resumo: Os microrganismos patogênicos são a causa de diversos problemas para a humanidade. Sua classificação é um importante passo para o entendimento e combate às doenças por eles causadas. Diversas tecnologias foram criadas para facilitar a classificação, e com o surgimento das tecnologias de sequenciamento de alto rendimento, esse trabalho foi imensamente acelerado. Entretanto isso gerou outro problema, pois volumes extremamente grandes de informação de sequências genéticas passaram a ser gerados, tornando a análise das sequências um processo que demanda muito tempo. No caso da família Geminiviridae, esse problema é somado à grande quantidade de novas sequências que são depositadas periodicamente nos bancos de dados públicos. Esses vírus são responsáveis por grandes perdas na produção de diversas de culturas de grande importância econômica em todo o mundo, o que leva à constante descoberta de novos geminivírus. Apesar de existirem diversas formas de classificar os microrganismos, a utilização da porcentagem de identidade obtida do alinhamento entre os indivíduos vem sendo cada dia mais aplicada. No caso de vírus com genoma pequeno, a utilização da identidade obtida de alinhamentos par-a-par já é aplicada há décadas, de modo que diversos algoritmos já foram criados para realizar essa tarefa. Entretanto nenhum dos algoritmos desenvolvidos até o presente realizam a classificação taxonômica dos vírus, deixando para o pesquisador o trabalho de realizar a classificação, vírus por vírus. Neste trabalho apresenta-se uma ferramenta que realiza a classificação de vírus da família Geminiviridae. A ferramenta é capaz de adquirir as sequências à medida que são adicionadas nos bancos de dados públicos, ou de recebê- las diretamente do usuário. Em seguida, filtra as sequencias adicionadas a fim de eliminar aquelas correspondentes a vírus já classificados, e analisa as restantes com base nas porcentagens de identidade obtidas do pareamento com os vírus já classificados. A ferramenta também atualiza os valores de limites de demarcação taxonômica utilizados para classificar esses vírus aos níveis de espécie e estirpe. Utilizando essa ferramenta foi possível analisar todos os vírus adicionados nos bancos de dados desde janeiro de 2017 até julho de 2018. Um total de 27 novas espécies foram identificadas. Sugere-se também atualizações nos limites de demarcação de espécies e estirpes para os gêneros Becurtovirus, Capulavirus, Curtovirus, Grablovirus e Mastrevirus.
id UFV_04e36c60441498ffa23f212e86725742
oai_identifier_str oai:locus.ufv.br:123456789/25202
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str 2145
spelling Gomes, Ruither Arthur Lochhttp://lattes.cnpq.br/6476684270507219Zerbini Júnior, Francisco Murilo2019-05-17T11:18:07Z2019-05-17T11:18:07Z2018-07-31GOMES, Ruither Arthur Loch. Automation tool for taxonomic classification in the family Geminiviridae. 2018. 39 f. Dissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2018.http://www.locus.ufv.br/handle/123456789/25202Os microrganismos patogênicos são a causa de diversos problemas para a humanidade. Sua classificação é um importante passo para o entendimento e combate às doenças por eles causadas. Diversas tecnologias foram criadas para facilitar a classificação, e com o surgimento das tecnologias de sequenciamento de alto rendimento, esse trabalho foi imensamente acelerado. Entretanto isso gerou outro problema, pois volumes extremamente grandes de informação de sequências genéticas passaram a ser gerados, tornando a análise das sequências um processo que demanda muito tempo. No caso da família Geminiviridae, esse problema é somado à grande quantidade de novas sequências que são depositadas periodicamente nos bancos de dados públicos. Esses vírus são responsáveis por grandes perdas na produção de diversas de culturas de grande importância econômica em todo o mundo, o que leva à constante descoberta de novos geminivírus. Apesar de existirem diversas formas de classificar os microrganismos, a utilização da porcentagem de identidade obtida do alinhamento entre os indivíduos vem sendo cada dia mais aplicada. No caso de vírus com genoma pequeno, a utilização da identidade obtida de alinhamentos par-a-par já é aplicada há décadas, de modo que diversos algoritmos já foram criados para realizar essa tarefa. Entretanto nenhum dos algoritmos desenvolvidos até o presente realizam a classificação taxonômica dos vírus, deixando para o pesquisador o trabalho de realizar a classificação, vírus por vírus. Neste trabalho apresenta-se uma ferramenta que realiza a classificação de vírus da família Geminiviridae. A ferramenta é capaz de adquirir as sequências à medida que são adicionadas nos bancos de dados públicos, ou de recebê- las diretamente do usuário. Em seguida, filtra as sequencias adicionadas a fim de eliminar aquelas correspondentes a vírus já classificados, e analisa as restantes com base nas porcentagens de identidade obtidas do pareamento com os vírus já classificados. A ferramenta também atualiza os valores de limites de demarcação taxonômica utilizados para classificar esses vírus aos níveis de espécie e estirpe. Utilizando essa ferramenta foi possível analisar todos os vírus adicionados nos bancos de dados desde janeiro de 2017 até julho de 2018. Um total de 27 novas espécies foram identificadas. Sugere-se também atualizações nos limites de demarcação de espécies e estirpes para os gêneros Becurtovirus, Capulavirus, Curtovirus, Grablovirus e Mastrevirus.Pathogenic microorganisms have the potential to cause serious problems for humankind. Their precise taxonomic classification is an important step for understanding and combating the diseases caused by them. Several technologies were created to make it easier to classify microorganisms, and with the emergence of high-throughput sequencing technologies this process has been hugely accelerated. However, this led to another problem, because extremely large volumes of genetic sequence information are generated, making the bioinformatic analysis of sequences a time-consuming process. In the case of viruses classified in the family Geminiviridae, this problem is compounded by the large amount of new sequences that are deposited in public databases. Geminiviruses are responsible for large losses of production in economically important crops worldwide, which makes them the focus of much research leading to the constant discovery of new viruses. Although there are several ways of performing the taxonomic classification of microorganisms, the use of the percentage of identity obtained from the alignment between individuals has been increasingly applied. In the case of viruses with small genomes, the use of percent identities obtained from pairwise alignments has been applied for decades, so that several algorithms have already been created to accomplish this goal. However, none of the algorithms developed until today carries out the classification of the virus, leaving to the researcher the work of deciding the taxonomic classification, one virus at a time. Here we present a tool that will carry out the classification of viruses in the Geminiviridae. This tool is capable of acquiring the sequences as they are added to public databases or receiving the sequences given by the user. It then filters the added sequences to eliminate those already classified and parses the remaining sequences based on their percentage of pairwise identity with classified viruses . It also updates the values of taxonomic demarcation thresholds used to classify species and strains. Using this tool, it was possible to analyze all viruses added to public databases from January 2017 until July 2018. A total of 27 new species were identified. We also suggest revised demarcation thresholds for the genera Becurtovirus, Capulavirus, Curtovirus, Grablovirus and Mastrevirus.Fundação de Amparo à Pesquisa do Estado de Minas GeraisengUniversidade Federal de ViçosaBegomovírus - IdentificaçãoMicro-organismos patogênicosVírus - ClassificaçãoBioinformáticaFitopatologiaAutomation tool for taxonomic classification in the family GeminiviridaeFerramenta de automatização para classificação taxonômica da família Geminiviridaeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de FitopatologiaMestre em Genética e MelhoramentoViçosa - MG2018-07-31Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf1882808https://locus.ufv.br//bitstream/123456789/25202/1/texto%20completo.pdf8a9e2aae66d31e38bc381977ff961f75MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/25202/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/252022019-05-23 14:49:24.911oai:locus.ufv.br:123456789/25202Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452019-05-23T17:49:24LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.en.fl_str_mv Automation tool for taxonomic classification in the family Geminiviridae
dc.title.pt-BR.fl_str_mv Ferramenta de automatização para classificação taxonômica da família Geminiviridae
title Automation tool for taxonomic classification in the family Geminiviridae
spellingShingle Automation tool for taxonomic classification in the family Geminiviridae
Gomes, Ruither Arthur Loch
Begomovírus - Identificação
Micro-organismos patogênicos
Vírus - Classificação
Bioinformática
Fitopatologia
title_short Automation tool for taxonomic classification in the family Geminiviridae
title_full Automation tool for taxonomic classification in the family Geminiviridae
title_fullStr Automation tool for taxonomic classification in the family Geminiviridae
title_full_unstemmed Automation tool for taxonomic classification in the family Geminiviridae
title_sort Automation tool for taxonomic classification in the family Geminiviridae
author Gomes, Ruither Arthur Loch
author_facet Gomes, Ruither Arthur Loch
author_role author
dc.contributor.authorLattes.pt-BR.fl_str_mv http://lattes.cnpq.br/6476684270507219
dc.contributor.author.fl_str_mv Gomes, Ruither Arthur Loch
dc.contributor.advisor1.fl_str_mv Zerbini Júnior, Francisco Murilo
contributor_str_mv Zerbini Júnior, Francisco Murilo
dc.subject.pt-BR.fl_str_mv Begomovírus - Identificação
Micro-organismos patogênicos
Vírus - Classificação
Bioinformática
topic Begomovírus - Identificação
Micro-organismos patogênicos
Vírus - Classificação
Bioinformática
Fitopatologia
dc.subject.cnpq.fl_str_mv Fitopatologia
description Os microrganismos patogênicos são a causa de diversos problemas para a humanidade. Sua classificação é um importante passo para o entendimento e combate às doenças por eles causadas. Diversas tecnologias foram criadas para facilitar a classificação, e com o surgimento das tecnologias de sequenciamento de alto rendimento, esse trabalho foi imensamente acelerado. Entretanto isso gerou outro problema, pois volumes extremamente grandes de informação de sequências genéticas passaram a ser gerados, tornando a análise das sequências um processo que demanda muito tempo. No caso da família Geminiviridae, esse problema é somado à grande quantidade de novas sequências que são depositadas periodicamente nos bancos de dados públicos. Esses vírus são responsáveis por grandes perdas na produção de diversas de culturas de grande importância econômica em todo o mundo, o que leva à constante descoberta de novos geminivírus. Apesar de existirem diversas formas de classificar os microrganismos, a utilização da porcentagem de identidade obtida do alinhamento entre os indivíduos vem sendo cada dia mais aplicada. No caso de vírus com genoma pequeno, a utilização da identidade obtida de alinhamentos par-a-par já é aplicada há décadas, de modo que diversos algoritmos já foram criados para realizar essa tarefa. Entretanto nenhum dos algoritmos desenvolvidos até o presente realizam a classificação taxonômica dos vírus, deixando para o pesquisador o trabalho de realizar a classificação, vírus por vírus. Neste trabalho apresenta-se uma ferramenta que realiza a classificação de vírus da família Geminiviridae. A ferramenta é capaz de adquirir as sequências à medida que são adicionadas nos bancos de dados públicos, ou de recebê- las diretamente do usuário. Em seguida, filtra as sequencias adicionadas a fim de eliminar aquelas correspondentes a vírus já classificados, e analisa as restantes com base nas porcentagens de identidade obtidas do pareamento com os vírus já classificados. A ferramenta também atualiza os valores de limites de demarcação taxonômica utilizados para classificar esses vírus aos níveis de espécie e estirpe. Utilizando essa ferramenta foi possível analisar todos os vírus adicionados nos bancos de dados desde janeiro de 2017 até julho de 2018. Um total de 27 novas espécies foram identificadas. Sugere-se também atualizações nos limites de demarcação de espécies e estirpes para os gêneros Becurtovirus, Capulavirus, Curtovirus, Grablovirus e Mastrevirus.
publishDate 2018
dc.date.issued.fl_str_mv 2018-07-31
dc.date.accessioned.fl_str_mv 2019-05-17T11:18:07Z
dc.date.available.fl_str_mv 2019-05-17T11:18:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GOMES, Ruither Arthur Loch. Automation tool for taxonomic classification in the family Geminiviridae. 2018. 39 f. Dissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2018.
dc.identifier.uri.fl_str_mv http://www.locus.ufv.br/handle/123456789/25202
identifier_str_mv GOMES, Ruither Arthur Loch. Automation tool for taxonomic classification in the family Geminiviridae. 2018. 39 f. Dissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2018.
url http://www.locus.ufv.br/handle/123456789/25202
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/25202/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/25202/2/license.txt
bitstream.checksum.fl_str_mv 8a9e2aae66d31e38bc381977ff961f75
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1801213082608861184