Automation tool for taxonomic classification in the family Geminiviridae
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | http://www.locus.ufv.br/handle/123456789/25202 |
Resumo: | Os microrganismos patogênicos são a causa de diversos problemas para a humanidade. Sua classificação é um importante passo para o entendimento e combate às doenças por eles causadas. Diversas tecnologias foram criadas para facilitar a classificação, e com o surgimento das tecnologias de sequenciamento de alto rendimento, esse trabalho foi imensamente acelerado. Entretanto isso gerou outro problema, pois volumes extremamente grandes de informação de sequências genéticas passaram a ser gerados, tornando a análise das sequências um processo que demanda muito tempo. No caso da família Geminiviridae, esse problema é somado à grande quantidade de novas sequências que são depositadas periodicamente nos bancos de dados públicos. Esses vírus são responsáveis por grandes perdas na produção de diversas de culturas de grande importância econômica em todo o mundo, o que leva à constante descoberta de novos geminivírus. Apesar de existirem diversas formas de classificar os microrganismos, a utilização da porcentagem de identidade obtida do alinhamento entre os indivíduos vem sendo cada dia mais aplicada. No caso de vírus com genoma pequeno, a utilização da identidade obtida de alinhamentos par-a-par já é aplicada há décadas, de modo que diversos algoritmos já foram criados para realizar essa tarefa. Entretanto nenhum dos algoritmos desenvolvidos até o presente realizam a classificação taxonômica dos vírus, deixando para o pesquisador o trabalho de realizar a classificação, vírus por vírus. Neste trabalho apresenta-se uma ferramenta que realiza a classificação de vírus da família Geminiviridae. A ferramenta é capaz de adquirir as sequências à medida que são adicionadas nos bancos de dados públicos, ou de recebê- las diretamente do usuário. Em seguida, filtra as sequencias adicionadas a fim de eliminar aquelas correspondentes a vírus já classificados, e analisa as restantes com base nas porcentagens de identidade obtidas do pareamento com os vírus já classificados. A ferramenta também atualiza os valores de limites de demarcação taxonômica utilizados para classificar esses vírus aos níveis de espécie e estirpe. Utilizando essa ferramenta foi possível analisar todos os vírus adicionados nos bancos de dados desde janeiro de 2017 até julho de 2018. Um total de 27 novas espécies foram identificadas. Sugere-se também atualizações nos limites de demarcação de espécies e estirpes para os gêneros Becurtovirus, Capulavirus, Curtovirus, Grablovirus e Mastrevirus. |
id |
UFV_04e36c60441498ffa23f212e86725742 |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/25202 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Gomes, Ruither Arthur Lochhttp://lattes.cnpq.br/6476684270507219Zerbini Júnior, Francisco Murilo2019-05-17T11:18:07Z2019-05-17T11:18:07Z2018-07-31GOMES, Ruither Arthur Loch. Automation tool for taxonomic classification in the family Geminiviridae. 2018. 39 f. Dissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2018.http://www.locus.ufv.br/handle/123456789/25202Os microrganismos patogênicos são a causa de diversos problemas para a humanidade. Sua classificação é um importante passo para o entendimento e combate às doenças por eles causadas. Diversas tecnologias foram criadas para facilitar a classificação, e com o surgimento das tecnologias de sequenciamento de alto rendimento, esse trabalho foi imensamente acelerado. Entretanto isso gerou outro problema, pois volumes extremamente grandes de informação de sequências genéticas passaram a ser gerados, tornando a análise das sequências um processo que demanda muito tempo. No caso da família Geminiviridae, esse problema é somado à grande quantidade de novas sequências que são depositadas periodicamente nos bancos de dados públicos. Esses vírus são responsáveis por grandes perdas na produção de diversas de culturas de grande importância econômica em todo o mundo, o que leva à constante descoberta de novos geminivírus. Apesar de existirem diversas formas de classificar os microrganismos, a utilização da porcentagem de identidade obtida do alinhamento entre os indivíduos vem sendo cada dia mais aplicada. No caso de vírus com genoma pequeno, a utilização da identidade obtida de alinhamentos par-a-par já é aplicada há décadas, de modo que diversos algoritmos já foram criados para realizar essa tarefa. Entretanto nenhum dos algoritmos desenvolvidos até o presente realizam a classificação taxonômica dos vírus, deixando para o pesquisador o trabalho de realizar a classificação, vírus por vírus. Neste trabalho apresenta-se uma ferramenta que realiza a classificação de vírus da família Geminiviridae. A ferramenta é capaz de adquirir as sequências à medida que são adicionadas nos bancos de dados públicos, ou de recebê- las diretamente do usuário. Em seguida, filtra as sequencias adicionadas a fim de eliminar aquelas correspondentes a vírus já classificados, e analisa as restantes com base nas porcentagens de identidade obtidas do pareamento com os vírus já classificados. A ferramenta também atualiza os valores de limites de demarcação taxonômica utilizados para classificar esses vírus aos níveis de espécie e estirpe. Utilizando essa ferramenta foi possível analisar todos os vírus adicionados nos bancos de dados desde janeiro de 2017 até julho de 2018. Um total de 27 novas espécies foram identificadas. Sugere-se também atualizações nos limites de demarcação de espécies e estirpes para os gêneros Becurtovirus, Capulavirus, Curtovirus, Grablovirus e Mastrevirus.Pathogenic microorganisms have the potential to cause serious problems for humankind. Their precise taxonomic classification is an important step for understanding and combating the diseases caused by them. Several technologies were created to make it easier to classify microorganisms, and with the emergence of high-throughput sequencing technologies this process has been hugely accelerated. However, this led to another problem, because extremely large volumes of genetic sequence information are generated, making the bioinformatic analysis of sequences a time-consuming process. In the case of viruses classified in the family Geminiviridae, this problem is compounded by the large amount of new sequences that are deposited in public databases. Geminiviruses are responsible for large losses of production in economically important crops worldwide, which makes them the focus of much research leading to the constant discovery of new viruses. Although there are several ways of performing the taxonomic classification of microorganisms, the use of the percentage of identity obtained from the alignment between individuals has been increasingly applied. In the case of viruses with small genomes, the use of percent identities obtained from pairwise alignments has been applied for decades, so that several algorithms have already been created to accomplish this goal. However, none of the algorithms developed until today carries out the classification of the virus, leaving to the researcher the work of deciding the taxonomic classification, one virus at a time. Here we present a tool that will carry out the classification of viruses in the Geminiviridae. This tool is capable of acquiring the sequences as they are added to public databases or receiving the sequences given by the user. It then filters the added sequences to eliminate those already classified and parses the remaining sequences based on their percentage of pairwise identity with classified viruses . It also updates the values of taxonomic demarcation thresholds used to classify species and strains. Using this tool, it was possible to analyze all viruses added to public databases from January 2017 until July 2018. A total of 27 new species were identified. We also suggest revised demarcation thresholds for the genera Becurtovirus, Capulavirus, Curtovirus, Grablovirus and Mastrevirus.Fundação de Amparo à Pesquisa do Estado de Minas GeraisengUniversidade Federal de ViçosaBegomovírus - IdentificaçãoMicro-organismos patogênicosVírus - ClassificaçãoBioinformáticaFitopatologiaAutomation tool for taxonomic classification in the family GeminiviridaeFerramenta de automatização para classificação taxonômica da família Geminiviridaeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal de ViçosaDepartamento de FitopatologiaMestre em Genética e MelhoramentoViçosa - MG2018-07-31Mestradoinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdftexto completo.pdftexto completoapplication/pdf1882808https://locus.ufv.br//bitstream/123456789/25202/1/texto%20completo.pdf8a9e2aae66d31e38bc381977ff961f75MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://locus.ufv.br//bitstream/123456789/25202/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52123456789/252022019-05-23 14:49:24.911oai:locus.ufv.br:123456789/25202Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452019-05-23T17:49:24LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.en.fl_str_mv |
Automation tool for taxonomic classification in the family Geminiviridae |
dc.title.pt-BR.fl_str_mv |
Ferramenta de automatização para classificação taxonômica da família Geminiviridae |
title |
Automation tool for taxonomic classification in the family Geminiviridae |
spellingShingle |
Automation tool for taxonomic classification in the family Geminiviridae Gomes, Ruither Arthur Loch Begomovírus - Identificação Micro-organismos patogênicos Vírus - Classificação Bioinformática Fitopatologia |
title_short |
Automation tool for taxonomic classification in the family Geminiviridae |
title_full |
Automation tool for taxonomic classification in the family Geminiviridae |
title_fullStr |
Automation tool for taxonomic classification in the family Geminiviridae |
title_full_unstemmed |
Automation tool for taxonomic classification in the family Geminiviridae |
title_sort |
Automation tool for taxonomic classification in the family Geminiviridae |
author |
Gomes, Ruither Arthur Loch |
author_facet |
Gomes, Ruither Arthur Loch |
author_role |
author |
dc.contributor.authorLattes.pt-BR.fl_str_mv |
http://lattes.cnpq.br/6476684270507219 |
dc.contributor.author.fl_str_mv |
Gomes, Ruither Arthur Loch |
dc.contributor.advisor1.fl_str_mv |
Zerbini Júnior, Francisco Murilo |
contributor_str_mv |
Zerbini Júnior, Francisco Murilo |
dc.subject.pt-BR.fl_str_mv |
Begomovírus - Identificação Micro-organismos patogênicos Vírus - Classificação Bioinformática |
topic |
Begomovírus - Identificação Micro-organismos patogênicos Vírus - Classificação Bioinformática Fitopatologia |
dc.subject.cnpq.fl_str_mv |
Fitopatologia |
description |
Os microrganismos patogênicos são a causa de diversos problemas para a humanidade. Sua classificação é um importante passo para o entendimento e combate às doenças por eles causadas. Diversas tecnologias foram criadas para facilitar a classificação, e com o surgimento das tecnologias de sequenciamento de alto rendimento, esse trabalho foi imensamente acelerado. Entretanto isso gerou outro problema, pois volumes extremamente grandes de informação de sequências genéticas passaram a ser gerados, tornando a análise das sequências um processo que demanda muito tempo. No caso da família Geminiviridae, esse problema é somado à grande quantidade de novas sequências que são depositadas periodicamente nos bancos de dados públicos. Esses vírus são responsáveis por grandes perdas na produção de diversas de culturas de grande importância econômica em todo o mundo, o que leva à constante descoberta de novos geminivírus. Apesar de existirem diversas formas de classificar os microrganismos, a utilização da porcentagem de identidade obtida do alinhamento entre os indivíduos vem sendo cada dia mais aplicada. No caso de vírus com genoma pequeno, a utilização da identidade obtida de alinhamentos par-a-par já é aplicada há décadas, de modo que diversos algoritmos já foram criados para realizar essa tarefa. Entretanto nenhum dos algoritmos desenvolvidos até o presente realizam a classificação taxonômica dos vírus, deixando para o pesquisador o trabalho de realizar a classificação, vírus por vírus. Neste trabalho apresenta-se uma ferramenta que realiza a classificação de vírus da família Geminiviridae. A ferramenta é capaz de adquirir as sequências à medida que são adicionadas nos bancos de dados públicos, ou de recebê- las diretamente do usuário. Em seguida, filtra as sequencias adicionadas a fim de eliminar aquelas correspondentes a vírus já classificados, e analisa as restantes com base nas porcentagens de identidade obtidas do pareamento com os vírus já classificados. A ferramenta também atualiza os valores de limites de demarcação taxonômica utilizados para classificar esses vírus aos níveis de espécie e estirpe. Utilizando essa ferramenta foi possível analisar todos os vírus adicionados nos bancos de dados desde janeiro de 2017 até julho de 2018. Um total de 27 novas espécies foram identificadas. Sugere-se também atualizações nos limites de demarcação de espécies e estirpes para os gêneros Becurtovirus, Capulavirus, Curtovirus, Grablovirus e Mastrevirus. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-07-31 |
dc.date.accessioned.fl_str_mv |
2019-05-17T11:18:07Z |
dc.date.available.fl_str_mv |
2019-05-17T11:18:07Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GOMES, Ruither Arthur Loch. Automation tool for taxonomic classification in the family Geminiviridae. 2018. 39 f. Dissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2018. |
dc.identifier.uri.fl_str_mv |
http://www.locus.ufv.br/handle/123456789/25202 |
identifier_str_mv |
GOMES, Ruither Arthur Loch. Automation tool for taxonomic classification in the family Geminiviridae. 2018. 39 f. Dissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2018. |
url |
http://www.locus.ufv.br/handle/123456789/25202 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/25202/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/25202/2/license.txt |
bitstream.checksum.fl_str_mv |
8a9e2aae66d31e38bc381977ff961f75 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801213082608861184 |