Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos

Detalhes bibliográficos
Autor(a) principal: Silva, Renann Rodrigues da
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UEPG
Texto Completo: http://tede2.uepg.br/jspui/handle/prefix/3320
Resumo: Nas áreas da saúde e agricultura, a identificação bacteriana é essencial para compreender a composição da comunidade microbiana e a sua ecologia. As técnicas de identificação de microrganismos buscam maior precisão, rapidez e menos custo. Uma técnica que vem sendo estudada e amplamente utilizada para a identificação de microrganismos é a identificação através de espectros de massa. Por meio de picos referentes às mais abundantes massas moleculares registradas no espectro, é possível gerar um perfil para reconhecimento de um microrganismo. Outra forma de identificar um espectro de massa, é por meio de picos que são esperados que apareçam no espectro, modelo cujo qual este trabalho fez uso. Para presumir os picos esperados no espectro, foram calculados os pesos moleculares estimados de proteínas ribossomais. Essas proteínas são denominadas house keeping, isto é, são onipresentes e responsáveis pelo funcionamento celular básico. Além de apresentarem em grande abundância no conteúdo procariótico, as proteínas ribossomais são altamente conservadas, não possuindo alteração em sua fisiologia para diferentes meios ou estágios celulares. Os pesos estimados formaram uma base de dados presumida, contendo todas as informações obtidas do repositório do NCBI e foram utilizados somente dados notados como completo, a base de dados criada recebeu o nome de Puchuy e possui 14689 registro. Esta base de dados presumida foi gerada para taxonomia a nível de Domínio, Filo, Classe, Ordem, Família, Gênero e Espécie, e posteriormente submetida à um aprendizado de máquina. Dessa forma, foi possível obter modelos classificatórios de microrganismos baseado em valores de proteínas ribossomais. Foram gerados modelos para cada nível taxonômico, os quais foram utilizados somente os que possuíram melhor desempenho para cada nível. Ainda foi adicionado um algoritmo de agrupamento para o auxílio da classificação. Com os modelos gerados pelo aprendizado de máquina, foi desenvolvido um software, capaz classificar os microrganismos a nível de Filo, Classe, Ordem, Família, Gênero e Espécie. Por fim, foram comparados diferentes classificadores para cada nível taxonômico, com e sem a utilização de um método de agrupamento.
id UEPG_6f8561761289e7a20813cfe606fc1fc4
oai_identifier_str oai:tede2.uepg.br:prefix/3320
network_acronym_str UEPG
network_name_str Biblioteca Digital de Teses e Dissertações da UEPG
repository_id_str
spelling Etto, Rafael Mazer27604256813http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AGdBq24O1IqhmGlQkA8-eQTTNvjbNs89imTtKMyCt79v9YL3O0Slk3n8OmPjC7Wg5uI6B3d-9zYqIFerjv046S6NR2pQ6T7rO2kGEwTL7h_tw8wTClhwIQlViJTroGsRV8dCDxTFpc2wYk7j5KubwwwI3h7yBghN7ua-tMcrJzN-vrY640GtYcPmXHHSuh5cRNLVoGReDKuipIpWc7jtsI2QEp2Z4bGSydVBn-ujSJEhCxgiQ6hjXDEVTslHftmYvRzv5NsZI56ouPlvXBGw8unXgB25ZGZvVbj4JKuWBaJjiOjWzSbkrxl7FJco6Yg6T9P79E5jHYawAobra9dItAZ5uojjMk8E5W-MgM60CS1WtR7WCXir_jXD7oftCYupsaauvj5MCUA97foiIO1NK9OXzloGQZHhN5alodhs6ll7gS9Embjc9Uv92ijh3IcHzGYeMvgKM7yZJL6g4tuv78Qi9Ger6Grk_AStets, Maria Isabel037.121.669-90http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4189612P9&tokenCaptchar=03AGdBq27U6uN3BEHBndgJhygy1L2etDjZIc8VPX2-Ryx6hkWxZOYt9-uh2R7tHVgwNDgbyClN-buEDmy3oktWOUivyvsqyfOtdq539s0gElN8PFYZgdd_aF8msfdBP3hhzfCAGy1RxZiPF7XKdbeKs1denCpGNCSTVPl3drocaBN-h1GoV3VlLdLz7UKN1RyKMeGFgbvV1iUXI06vb5FpBZ_ijzX-MIlvytHvDVWytcq-XhFYTd5vbTFWI2x1O202gqm7qF770QZ5LMNyBuvVFE_UsDSbt3hx3WKNcTaukd421JoJjwFc2O1MW-uRZw1TWNM6u0_RDgv2tpVrMAKtsS0jOoL6NF3_oSa71DsaKbRks1S_U3mW2Cn9XkRw76Lma1cGgk9ySdIhbuCriZ5VuOSL0OaNa8H-kC9a7JHF5s_LuGc3qfoqrUS4Biain-a-tQAGWOdW8-KQnJIvB60nFdzx5vGF76H3nwRocha, Jose Carlos Ferreira da64502430900Instituto de Biologia Molecular do Paraná (IBMP)Universidade Estadual de Ponta Grossa09890213940http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8060249A3&tokenCaptchar=03AGdBq245BsVPMc7BN5agTTzV4pGzlIX9-Jg2al0LkUjdV9Eqp-dhLPyxdfBpy5R1OfxnbbIfIFedYp2lXgoOoBV8VTWSEhFqJaGPmQnIH0_Zs8cf6I9Dh4ST9suzLOhYeo3g63EF2s2d2Of8tgVuUa0xmNzKGUmXE1ToPqWhLu5vFKZlAo5peNYxQCCzS27sbtlcePalaE2kE3EmXmw4YDxYajTx2MZuLh_Pnvj3Iq9lvnoSoqnWeKuUdLaTZvgdxBYMmTqo30cHgU7Vi1DJ1H3zoBbw0qwb_YaU_MK15LXasCJR9-IbQMyqPF17eZjMf6QhlG6yDvWSqAhvB2wWuFH-AABLah6bEXrkdJUTO7o6nOO8Vtk_x1fEDR1b27E2HLTCxtMWLwdMGo0Go1ohq31lGfWKSoaQMHCxEpXfI_-G5Mm0G0KQpadi5b1RzNRsi5GGAtA2E1GhHz8N8Zindq23DEHPoU_CmgSilva, Renann Rodrigues da2021-03-10T11:46:55Z2021-03-092021-03-10T11:46:55Z2020-12-04SILVA, Renann Rodrigues da. Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos. 2021. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2021.http://tede2.uepg.br/jspui/handle/prefix/3320Nas áreas da saúde e agricultura, a identificação bacteriana é essencial para compreender a composição da comunidade microbiana e a sua ecologia. As técnicas de identificação de microrganismos buscam maior precisão, rapidez e menos custo. Uma técnica que vem sendo estudada e amplamente utilizada para a identificação de microrganismos é a identificação através de espectros de massa. Por meio de picos referentes às mais abundantes massas moleculares registradas no espectro, é possível gerar um perfil para reconhecimento de um microrganismo. Outra forma de identificar um espectro de massa, é por meio de picos que são esperados que apareçam no espectro, modelo cujo qual este trabalho fez uso. Para presumir os picos esperados no espectro, foram calculados os pesos moleculares estimados de proteínas ribossomais. Essas proteínas são denominadas house keeping, isto é, são onipresentes e responsáveis pelo funcionamento celular básico. Além de apresentarem em grande abundância no conteúdo procariótico, as proteínas ribossomais são altamente conservadas, não possuindo alteração em sua fisiologia para diferentes meios ou estágios celulares. Os pesos estimados formaram uma base de dados presumida, contendo todas as informações obtidas do repositório do NCBI e foram utilizados somente dados notados como completo, a base de dados criada recebeu o nome de Puchuy e possui 14689 registro. Esta base de dados presumida foi gerada para taxonomia a nível de Domínio, Filo, Classe, Ordem, Família, Gênero e Espécie, e posteriormente submetida à um aprendizado de máquina. Dessa forma, foi possível obter modelos classificatórios de microrganismos baseado em valores de proteínas ribossomais. Foram gerados modelos para cada nível taxonômico, os quais foram utilizados somente os que possuíram melhor desempenho para cada nível. Ainda foi adicionado um algoritmo de agrupamento para o auxílio da classificação. Com os modelos gerados pelo aprendizado de máquina, foi desenvolvido um software, capaz classificar os microrganismos a nível de Filo, Classe, Ordem, Família, Gênero e Espécie. Por fim, foram comparados diferentes classificadores para cada nível taxonômico, com e sem a utilização de um método de agrupamento.In health and agriculture, bacterial identification is essential to understand the composition of the microbial community and its ecology. Microorganism identification techniques seek greater accuracy, speed, and less cost. One technique that has been studied and widely used for the identification of microorganisms is the identification through mass spectra. Through peaks referring to the most abundant molecular masses recorded in the spectrum, it is possible to generate a profile for the recognition of a microorganism. Another way to identify a mass spectrum is through peaks that are expected to appear in the spectrum, the model which this work has made use of. To assume the expected peaks in the spectrum, estimated molecular weights of ribosomal proteins were calculated. These proteins are called housekeeping, that is, they are ubiquitous and responsible for the basic cellular functioning. In addition to their abundant prokaryotic content, ribosomal proteins are highly conserved and do not change their physiology for different cell media or stages. The estimated weights formed a presumed database containing all information obtained from the NCBI repository and only data noted as complete were used, the database created was named Puchuy and has 14689 records. This presumed database was generated for taxonomy at Domain, Phylum, Class, Order, Family, Genus, and Species level, and then subjected to machine learning. Thus, it was possible to obtain classification models of microorganisms based on ribosomal protein values. Models were generated for each taxonomic level, which was used only for those that had better performance for each level. A clustering algorithm was also added to aid classification. With the models generated by the machine learning, the software was developed, able to classify the microorganisms in the Phylum, Class, Order, Family, Genus and Species level. Finally, different classifiers were compared for each taxonomic level, with and without the use of a clustering method.Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2021-03-10T11:46:55Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Renann Rodrigues da Silva.pdf: 2417915 bytes, checksum: 0d767dc440edcf57a88e8eecf9335174 (MD5)Made available in DSpace on 2021-03-10T11:46:55Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Renann Rodrigues da Silva.pdf: 2417915 bytes, checksum: 0d767dc440edcf57a88e8eecf9335174 (MD5) Previous issue date: 2020-12-04Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Estadual de Ponta GrossaPrograma de Pós Graduação Computação AplicadaUEPGBrasilDepartamento de InformáticaAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOProteínas RibossomaisEspectrometria de MassaPesos molecularesAprendizado de MáquinaRibosomal ProteinsMass spectrometryMolecular WeightsMachine LearningClassificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Biblioteca Digital de Teses e Dissertações da UEPGinstname:Universidade Estadual de Ponta Grossa (UEPG)instacron:UEPGLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://tede2.uepg.br/jspui/bitstream/prefix/3320/3/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811http://tede2.uepg.br/jspui/bitstream/prefix/3320/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALRenann Rodrigues da Silva.pdfRenann Rodrigues da Silva.pdfdissertação completa em pdfapplication/pdf2417915http://tede2.uepg.br/jspui/bitstream/prefix/3320/1/Renann%20Rodrigues%20da%20Silva.pdf0d767dc440edcf57a88e8eecf9335174MD51prefix/33202021-03-10 08:46:55.878oai:tede2.uepg.br:prefix/3320TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KBiblioteca Digital de Teses e Dissertaçõeshttps://tede2.uepg.br/jspui/PUBhttp://tede2.uepg.br/oai/requestbicen@uepg.br||mv_fidelis@yahoo.com.bropendoar:2021-03-10T11:46:55Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)false
dc.title.pt_BR.fl_str_mv Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
title Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
spellingShingle Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
Silva, Renann Rodrigues da
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Proteínas Ribossomais
Espectrometria de Massa
Pesos moleculares
Aprendizado de Máquina
Ribosomal Proteins
Mass spectrometry
Molecular Weights
Machine Learning
title_short Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
title_full Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
title_fullStr Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
title_full_unstemmed Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
title_sort Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
author Silva, Renann Rodrigues da
author_facet Silva, Renann Rodrigues da
author_role author
dc.contributor.instituicao-banca1.pt_BR.fl_str_mv Instituto de Biologia Molecular do Paraná (IBMP)
dc.contributor.instituicao-banca2.pt_BR.fl_str_mv Universidade Estadual de Ponta Grossa
dc.contributor.advisor1.fl_str_mv Etto, Rafael Mazer
dc.contributor.advisor1ID.fl_str_mv 27604256813
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AGdBq24O1IqhmGlQkA8-eQTTNvjbNs89imTtKMyCt79v9YL3O0Slk3n8OmPjC7Wg5uI6B3d-9zYqIFerjv046S6NR2pQ6T7rO2kGEwTL7h_tw8wTClhwIQlViJTroGsRV8dCDxTFpc2wYk7j5KubwwwI3h7yBghN7ua-tMcrJzN-vrY640GtYcPmXHHSuh5cRNLVoGReDKuipIpWc7jtsI2QEp2Z4bGSydVBn-ujSJEhCxgiQ6hjXDEVTslHftmYvRzv5NsZI56ouPlvXBGw8unXgB25ZGZvVbj4JKuWBaJjiOjWzSbkrxl7FJco6Yg6T9P79E5jHYawAobra9dItAZ5uojjMk8E5W-MgM60CS1WtR7WCXir_jXD7oftCYupsaauvj5MCUA97foiIO1NK9OXzloGQZHhN5alodhs6ll7gS9Embjc9Uv92ijh3IcHzGYeMvgKM7yZJL6g4tuv78Qi9Ger6Grk_A
dc.contributor.referee1.fl_str_mv Stets, Maria Isabel
dc.contributor.referee1ID.fl_str_mv 037.121.669-90
dc.contributor.referee1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4189612P9&tokenCaptchar=03AGdBq27U6uN3BEHBndgJhygy1L2etDjZIc8VPX2-Ryx6hkWxZOYt9-uh2R7tHVgwNDgbyClN-buEDmy3oktWOUivyvsqyfOtdq539s0gElN8PFYZgdd_aF8msfdBP3hhzfCAGy1RxZiPF7XKdbeKs1denCpGNCSTVPl3drocaBN-h1GoV3VlLdLz7UKN1RyKMeGFgbvV1iUXI06vb5FpBZ_ijzX-MIlvytHvDVWytcq-XhFYTd5vbTFWI2x1O202gqm7qF770QZ5LMNyBuvVFE_UsDSbt3hx3WKNcTaukd421JoJjwFc2O1MW-uRZw1TWNM6u0_RDgv2tpVrMAKtsS0jOoL6NF3_oSa71DsaKbRks1S_U3mW2Cn9XkRw76Lma1cGgk9ySdIhbuCriZ5VuOSL0OaNa8H-kC9a7JHF5s_LuGc3qfoqrUS4Biain-a-tQAGWOdW8-KQnJIvB60nFdzx5vGF76H3nw
dc.contributor.referee2.fl_str_mv Rocha, Jose Carlos Ferreira da
dc.contributor.referee2ID.fl_str_mv 64502430900
dc.contributor.authorID.fl_str_mv 09890213940
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8060249A3&tokenCaptchar=03AGdBq245BsVPMc7BN5agTTzV4pGzlIX9-Jg2al0LkUjdV9Eqp-dhLPyxdfBpy5R1OfxnbbIfIFedYp2lXgoOoBV8VTWSEhFqJaGPmQnIH0_Zs8cf6I9Dh4ST9suzLOhYeo3g63EF2s2d2Of8tgVuUa0xmNzKGUmXE1ToPqWhLu5vFKZlAo5peNYxQCCzS27sbtlcePalaE2kE3EmXmw4YDxYajTx2MZuLh_Pnvj3Iq9lvnoSoqnWeKuUdLaTZvgdxBYMmTqo30cHgU7Vi1DJ1H3zoBbw0qwb_YaU_MK15LXasCJR9-IbQMyqPF17eZjMf6QhlG6yDvWSqAhvB2wWuFH-AABLah6bEXrkdJUTO7o6nOO8Vtk_x1fEDR1b27E2HLTCxtMWLwdMGo0Go1ohq31lGfWKSoaQMHCxEpXfI_-G5Mm0G0KQpadi5b1RzNRsi5GGAtA2E1GhHz8N8Zindq23DEHPoU_Cmg
dc.contributor.author.fl_str_mv Silva, Renann Rodrigues da
contributor_str_mv Etto, Rafael Mazer
Stets, Maria Isabel
Rocha, Jose Carlos Ferreira da
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Proteínas Ribossomais
Espectrometria de Massa
Pesos moleculares
Aprendizado de Máquina
Ribosomal Proteins
Mass spectrometry
Molecular Weights
Machine Learning
dc.subject.por.fl_str_mv Proteínas Ribossomais
Espectrometria de Massa
Pesos moleculares
Aprendizado de Máquina
Ribosomal Proteins
Mass spectrometry
Molecular Weights
Machine Learning
description Nas áreas da saúde e agricultura, a identificação bacteriana é essencial para compreender a composição da comunidade microbiana e a sua ecologia. As técnicas de identificação de microrganismos buscam maior precisão, rapidez e menos custo. Uma técnica que vem sendo estudada e amplamente utilizada para a identificação de microrganismos é a identificação através de espectros de massa. Por meio de picos referentes às mais abundantes massas moleculares registradas no espectro, é possível gerar um perfil para reconhecimento de um microrganismo. Outra forma de identificar um espectro de massa, é por meio de picos que são esperados que apareçam no espectro, modelo cujo qual este trabalho fez uso. Para presumir os picos esperados no espectro, foram calculados os pesos moleculares estimados de proteínas ribossomais. Essas proteínas são denominadas house keeping, isto é, são onipresentes e responsáveis pelo funcionamento celular básico. Além de apresentarem em grande abundância no conteúdo procariótico, as proteínas ribossomais são altamente conservadas, não possuindo alteração em sua fisiologia para diferentes meios ou estágios celulares. Os pesos estimados formaram uma base de dados presumida, contendo todas as informações obtidas do repositório do NCBI e foram utilizados somente dados notados como completo, a base de dados criada recebeu o nome de Puchuy e possui 14689 registro. Esta base de dados presumida foi gerada para taxonomia a nível de Domínio, Filo, Classe, Ordem, Família, Gênero e Espécie, e posteriormente submetida à um aprendizado de máquina. Dessa forma, foi possível obter modelos classificatórios de microrganismos baseado em valores de proteínas ribossomais. Foram gerados modelos para cada nível taxonômico, os quais foram utilizados somente os que possuíram melhor desempenho para cada nível. Ainda foi adicionado um algoritmo de agrupamento para o auxílio da classificação. Com os modelos gerados pelo aprendizado de máquina, foi desenvolvido um software, capaz classificar os microrganismos a nível de Filo, Classe, Ordem, Família, Gênero e Espécie. Por fim, foram comparados diferentes classificadores para cada nível taxonômico, com e sem a utilização de um método de agrupamento.
publishDate 2020
dc.date.issued.fl_str_mv 2020-12-04
dc.date.accessioned.fl_str_mv 2021-03-10T11:46:55Z
dc.date.available.fl_str_mv 2021-03-09
2021-03-10T11:46:55Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Renann Rodrigues da. Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos. 2021. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2021.
dc.identifier.uri.fl_str_mv http://tede2.uepg.br/jspui/handle/prefix/3320
identifier_str_mv SILVA, Renann Rodrigues da. Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos. 2021. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2021.
url http://tede2.uepg.br/jspui/handle/prefix/3320
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Estadual de Ponta Grossa
dc.publisher.program.fl_str_mv Programa de Pós Graduação Computação Aplicada
dc.publisher.initials.fl_str_mv UEPG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento de Informática
publisher.none.fl_str_mv Universidade Estadual de Ponta Grossa
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UEPG
instname:Universidade Estadual de Ponta Grossa (UEPG)
instacron:UEPG
instname_str Universidade Estadual de Ponta Grossa (UEPG)
instacron_str UEPG
institution UEPG
reponame_str Biblioteca Digital de Teses e Dissertações da UEPG
collection Biblioteca Digital de Teses e Dissertações da UEPG
bitstream.url.fl_str_mv http://tede2.uepg.br/jspui/bitstream/prefix/3320/3/license.txt
http://tede2.uepg.br/jspui/bitstream/prefix/3320/2/license_rdf
http://tede2.uepg.br/jspui/bitstream/prefix/3320/1/Renann%20Rodrigues%20da%20Silva.pdf
bitstream.checksum.fl_str_mv 43cd690d6a359e86c1fe3d5b7cba0c9b
e39d27027a6cc9cb039ad269a5db8e34
0d767dc440edcf57a88e8eecf9335174
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)
repository.mail.fl_str_mv bicen@uepg.br||mv_fidelis@yahoo.com.br
_version_ 1800232818256642048