Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp

Detalhes bibliográficos
Autor(a) principal: Labonde, Julia
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPel - Guaiaca
Texto Completo: http://repositorio.ufpel.edu.br/handle/prefix/3710
Resumo: A leptospirose é uma doença infecciosa de importância mundial, que afeta humanos e animais, causada por espiroquetas patogênicas pertencentes ao gênero Leptospira. Para a área epidemiológica e clínica é fundamental que os laboratórios tenham a capacidade de identificar e classificar com precisão as espécies de Leptospira que causam doença, para que sejam tomadas decisões coerentes com relação à saúde pública. Neste estudo, nós relatamos pela primeira vez a utilização de ferramentas de mineração de dados para fins de classificação de cepas do gênero Leptospira. Vinte e cinco loci referentes a 15 genes foram selecionadas e analisados em 600 genomas rascunho de Leptospira, com o propósito de buscar polimorfismos que pudessem ser utilizados na classificação de cada espécie. Para isso, foram utilizados os algoritmos baseados em mineração de dados C4.5, Naive Bayes e Support Vector Machine. Todos os algoritmos computacionais de mineração de dados utilizados neste trabalho apresentaram valores de acurácia acima de 93% para classificação de Leptospira a nível de espécie, no entanto, o algoritmo C4.5, além de atingir a melhor acurácia de classificação (95.6%), também apresentou os genes que contribuíram para o resultado final da análise. O mesmo banco de dados genômicos utilizado pelos algoritmos computacionais foi submetido a testes com a metodologia MLST – técnica mais utilizada para classificação molecular de espécies deste gênero – no entanto, nenhum dos testes apresentou acurácia superior a 80%. Visto o algoritmo de mineração de dados C4.5 atingir uma acurácia superior aos outros algoritmos, pode-se concluir que C4.5 é uma ferramenta de mineração de dados bastante promissora para classificar espécies de Leptospira.
id UFPL_3bdced0e8cecce7876c5d3c6e761be20
oai_identifier_str oai:guaiaca.ufpel.edu.br:prefix/3710
network_acronym_str UFPL
network_name_str Repositório Institucional da UFPel - Guaiaca
repository_id_str
spelling 2017-09-01T19:14:45Z2017-09-01T19:14:45Z2016-02-19LABONDE, Julia. Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp. 2016. 37f. Dissertação (Mestrado) - Programa de Pós-Graduação em Biotecnologia. Universidade Federal de Pelotas, Pelotas.http://repositorio.ufpel.edu.br/handle/prefix/3710A leptospirose é uma doença infecciosa de importância mundial, que afeta humanos e animais, causada por espiroquetas patogênicas pertencentes ao gênero Leptospira. Para a área epidemiológica e clínica é fundamental que os laboratórios tenham a capacidade de identificar e classificar com precisão as espécies de Leptospira que causam doença, para que sejam tomadas decisões coerentes com relação à saúde pública. Neste estudo, nós relatamos pela primeira vez a utilização de ferramentas de mineração de dados para fins de classificação de cepas do gênero Leptospira. Vinte e cinco loci referentes a 15 genes foram selecionadas e analisados em 600 genomas rascunho de Leptospira, com o propósito de buscar polimorfismos que pudessem ser utilizados na classificação de cada espécie. Para isso, foram utilizados os algoritmos baseados em mineração de dados C4.5, Naive Bayes e Support Vector Machine. Todos os algoritmos computacionais de mineração de dados utilizados neste trabalho apresentaram valores de acurácia acima de 93% para classificação de Leptospira a nível de espécie, no entanto, o algoritmo C4.5, além de atingir a melhor acurácia de classificação (95.6%), também apresentou os genes que contribuíram para o resultado final da análise. O mesmo banco de dados genômicos utilizado pelos algoritmos computacionais foi submetido a testes com a metodologia MLST – técnica mais utilizada para classificação molecular de espécies deste gênero – no entanto, nenhum dos testes apresentou acurácia superior a 80%. Visto o algoritmo de mineração de dados C4.5 atingir uma acurácia superior aos outros algoritmos, pode-se concluir que C4.5 é uma ferramenta de mineração de dados bastante promissora para classificar espécies de Leptospira.Leptospirosis is an infectious disease of global importance that affects humans and animals caused by pathogenic spirochetes belonging to the genus Leptospira. For epidemiological and clinical areas, it is essential that laboratories have the ability to identify and classify accurately species of Leptospira that cause disease, to take decisions consistent with respect to public health. In this study, we report for the first time the use of data mining tools for the purposes of strain classification of the genus Leptospira. Twenty-five loci related to 15 genes were selected and analyzed in 600 Leptospira draft genomes in order to search polymorphisms that could be used for the classification of each species. For this, data mining-based algorithms - C4.5, Naive Bayes and SVM - were used. All data mining computational algorithms used in this study showed accuracy levels above 93% for Leptospira classification species, however, the C4.5 algorithm achieve the best accuracy rating (95.6%) and presented the genes that contributed to the final result of the analysis. The same genomic database used by computer algorithms has been tested with the MLST methodology – most used technique for molecular classification of species of this genus - however, none of the tests show accuracy higher to 80%. Because data mining algorithm C4.5 achieve better accuracy than other algorithms, it can be concluded that C4.5 is a very promising data mining tool to classify species of Leptospira.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESporUniversidade Federal de PelotasPrograma de Pós-Graduação em BiotecnologiaUFPelBrasilCentro de Desenvolvimento TecnológicoCNPQ::OUTROSBiotecnologiaLeptospiraMineração de dadosAlgoritmos computacionaisData miningComputational algorithmsAplicação de algoritmos de mineração de dados para classificação molecular de Leptospira sppApplication of data mining algorithms for molecular classification of Leptospira sppinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://lattes.cnpq.br/5606708840951379http://lattes.cnpq.br/4649853685495071Dellagostin, Odir AntônioLabonde, Juliainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPELTEXTdissertacao_julia_labonde.pdf.txtdissertacao_julia_labonde.pdf.txtExtracted texttext/plain62417http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/6/dissertacao_julia_labonde.pdf.txt79aaefd773274bef02d9eefa025f7fedMD56open accessTHUMBNAILdissertacao_julia_labonde.pdf.jpgdissertacao_julia_labonde.pdf.jpgGenerated Thumbnailimage/jpeg1364http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/7/dissertacao_julia_labonde.pdf.jpg5fc083d1c6ce8f98cf00a69554eb1f2cMD57open accessORIGINALdissertacao_julia_labonde.pdfdissertacao_julia_labonde.pdfapplication/pdf678599http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/1/dissertacao_julia_labonde.pdfd233ff13ddb416df716b9ee25c98978dMD51open accessCC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/2/license_url4afdbb8c545fd630ea7db775da747b2fMD52open accesslicense_textlicense_texttext/html; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53open accesslicense_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/5/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD55open accessprefix/37102023-07-13 06:10:27.066open accessoai:guaiaca.ufpel.edu.br:prefix/3710TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2023-07-13T09:10:27Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false
dc.title.pt_BR.fl_str_mv Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
dc.title.alternative.pt_BR.fl_str_mv Application of data mining algorithms for molecular classification of Leptospira spp
title Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
spellingShingle Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
Labonde, Julia
CNPQ::OUTROS
Biotecnologia
Leptospira
Mineração de dados
Algoritmos computacionais
Data mining
Computational algorithms
title_short Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
title_full Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
title_fullStr Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
title_full_unstemmed Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
title_sort Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp
author Labonde, Julia
author_facet Labonde, Julia
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5606708840951379
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4649853685495071
dc.contributor.advisor1.fl_str_mv Dellagostin, Odir Antônio
dc.contributor.author.fl_str_mv Labonde, Julia
contributor_str_mv Dellagostin, Odir Antônio
dc.subject.cnpq.fl_str_mv CNPQ::OUTROS
topic CNPQ::OUTROS
Biotecnologia
Leptospira
Mineração de dados
Algoritmos computacionais
Data mining
Computational algorithms
dc.subject.por.fl_str_mv Biotecnologia
Leptospira
Mineração de dados
Algoritmos computacionais
Data mining
Computational algorithms
description A leptospirose é uma doença infecciosa de importância mundial, que afeta humanos e animais, causada por espiroquetas patogênicas pertencentes ao gênero Leptospira. Para a área epidemiológica e clínica é fundamental que os laboratórios tenham a capacidade de identificar e classificar com precisão as espécies de Leptospira que causam doença, para que sejam tomadas decisões coerentes com relação à saúde pública. Neste estudo, nós relatamos pela primeira vez a utilização de ferramentas de mineração de dados para fins de classificação de cepas do gênero Leptospira. Vinte e cinco loci referentes a 15 genes foram selecionadas e analisados em 600 genomas rascunho de Leptospira, com o propósito de buscar polimorfismos que pudessem ser utilizados na classificação de cada espécie. Para isso, foram utilizados os algoritmos baseados em mineração de dados C4.5, Naive Bayes e Support Vector Machine. Todos os algoritmos computacionais de mineração de dados utilizados neste trabalho apresentaram valores de acurácia acima de 93% para classificação de Leptospira a nível de espécie, no entanto, o algoritmo C4.5, além de atingir a melhor acurácia de classificação (95.6%), também apresentou os genes que contribuíram para o resultado final da análise. O mesmo banco de dados genômicos utilizado pelos algoritmos computacionais foi submetido a testes com a metodologia MLST – técnica mais utilizada para classificação molecular de espécies deste gênero – no entanto, nenhum dos testes apresentou acurácia superior a 80%. Visto o algoritmo de mineração de dados C4.5 atingir uma acurácia superior aos outros algoritmos, pode-se concluir que C4.5 é uma ferramenta de mineração de dados bastante promissora para classificar espécies de Leptospira.
publishDate 2016
dc.date.issued.fl_str_mv 2016-02-19
dc.date.accessioned.fl_str_mv 2017-09-01T19:14:45Z
dc.date.available.fl_str_mv 2017-09-01T19:14:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LABONDE, Julia. Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp. 2016. 37f. Dissertação (Mestrado) - Programa de Pós-Graduação em Biotecnologia. Universidade Federal de Pelotas, Pelotas.
dc.identifier.uri.fl_str_mv http://repositorio.ufpel.edu.br/handle/prefix/3710
identifier_str_mv LABONDE, Julia. Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp. 2016. 37f. Dissertação (Mestrado) - Programa de Pós-Graduação em Biotecnologia. Universidade Federal de Pelotas, Pelotas.
url http://repositorio.ufpel.edu.br/handle/prefix/3710
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Biotecnologia
dc.publisher.initials.fl_str_mv UFPel
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Desenvolvimento Tecnológico
publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPel - Guaiaca
instname:Universidade Federal de Pelotas (UFPEL)
instacron:UFPEL
instname_str Universidade Federal de Pelotas (UFPEL)
instacron_str UFPEL
institution UFPEL
reponame_str Repositório Institucional da UFPel - Guaiaca
collection Repositório Institucional da UFPel - Guaiaca
bitstream.url.fl_str_mv http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/6/dissertacao_julia_labonde.pdf.txt
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/7/dissertacao_julia_labonde.pdf.jpg
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/1/dissertacao_julia_labonde.pdf
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/2/license_url
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/3/license_text
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/4/license_rdf
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/3710/5/license.txt
bitstream.checksum.fl_str_mv 79aaefd773274bef02d9eefa025f7fed
5fc083d1c6ce8f98cf00a69554eb1f2c
d233ff13ddb416df716b9ee25c98978d
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
43cd690d6a359e86c1fe3d5b7cba0c9b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)
repository.mail.fl_str_mv rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br
_version_ 1813710162615074816