Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UEPG |
Texto Completo: | http://tede2.uepg.br/jspui/handle/prefix/3320 |
Resumo: | Nas áreas da saúde e agricultura, a identificação bacteriana é essencial para compreender a composição da comunidade microbiana e a sua ecologia. As técnicas de identificação de microrganismos buscam maior precisão, rapidez e menos custo. Uma técnica que vem sendo estudada e amplamente utilizada para a identificação de microrganismos é a identificação através de espectros de massa. Por meio de picos referentes às mais abundantes massas moleculares registradas no espectro, é possível gerar um perfil para reconhecimento de um microrganismo. Outra forma de identificar um espectro de massa, é por meio de picos que são esperados que apareçam no espectro, modelo cujo qual este trabalho fez uso. Para presumir os picos esperados no espectro, foram calculados os pesos moleculares estimados de proteínas ribossomais. Essas proteínas são denominadas house keeping, isto é, são onipresentes e responsáveis pelo funcionamento celular básico. Além de apresentarem em grande abundância no conteúdo procariótico, as proteínas ribossomais são altamente conservadas, não possuindo alteração em sua fisiologia para diferentes meios ou estágios celulares. Os pesos estimados formaram uma base de dados presumida, contendo todas as informações obtidas do repositório do NCBI e foram utilizados somente dados notados como completo, a base de dados criada recebeu o nome de Puchuy e possui 14689 registro. Esta base de dados presumida foi gerada para taxonomia a nível de Domínio, Filo, Classe, Ordem, Família, Gênero e Espécie, e posteriormente submetida à um aprendizado de máquina. Dessa forma, foi possível obter modelos classificatórios de microrganismos baseado em valores de proteínas ribossomais. Foram gerados modelos para cada nível taxonômico, os quais foram utilizados somente os que possuíram melhor desempenho para cada nível. Ainda foi adicionado um algoritmo de agrupamento para o auxílio da classificação. Com os modelos gerados pelo aprendizado de máquina, foi desenvolvido um software, capaz classificar os microrganismos a nível de Filo, Classe, Ordem, Família, Gênero e Espécie. Por fim, foram comparados diferentes classificadores para cada nível taxonômico, com e sem a utilização de um método de agrupamento. |
id |
UEPG_6f8561761289e7a20813cfe606fc1fc4 |
---|---|
oai_identifier_str |
oai:tede2.uepg.br:prefix/3320 |
network_acronym_str |
UEPG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UEPG |
repository_id_str |
|
spelling |
Etto, Rafael Mazer27604256813http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AGdBq24O1IqhmGlQkA8-eQTTNvjbNs89imTtKMyCt79v9YL3O0Slk3n8OmPjC7Wg5uI6B3d-9zYqIFerjv046S6NR2pQ6T7rO2kGEwTL7h_tw8wTClhwIQlViJTroGsRV8dCDxTFpc2wYk7j5KubwwwI3h7yBghN7ua-tMcrJzN-vrY640GtYcPmXHHSuh5cRNLVoGReDKuipIpWc7jtsI2QEp2Z4bGSydVBn-ujSJEhCxgiQ6hjXDEVTslHftmYvRzv5NsZI56ouPlvXBGw8unXgB25ZGZvVbj4JKuWBaJjiOjWzSbkrxl7FJco6Yg6T9P79E5jHYawAobra9dItAZ5uojjMk8E5W-MgM60CS1WtR7WCXir_jXD7oftCYupsaauvj5MCUA97foiIO1NK9OXzloGQZHhN5alodhs6ll7gS9Embjc9Uv92ijh3IcHzGYeMvgKM7yZJL6g4tuv78Qi9Ger6Grk_AStets, Maria Isabel037.121.669-90http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4189612P9&tokenCaptchar=03AGdBq27U6uN3BEHBndgJhygy1L2etDjZIc8VPX2-Ryx6hkWxZOYt9-uh2R7tHVgwNDgbyClN-buEDmy3oktWOUivyvsqyfOtdq539s0gElN8PFYZgdd_aF8msfdBP3hhzfCAGy1RxZiPF7XKdbeKs1denCpGNCSTVPl3drocaBN-h1GoV3VlLdLz7UKN1RyKMeGFgbvV1iUXI06vb5FpBZ_ijzX-MIlvytHvDVWytcq-XhFYTd5vbTFWI2x1O202gqm7qF770QZ5LMNyBuvVFE_UsDSbt3hx3WKNcTaukd421JoJjwFc2O1MW-uRZw1TWNM6u0_RDgv2tpVrMAKtsS0jOoL6NF3_oSa71DsaKbRks1S_U3mW2Cn9XkRw76Lma1cGgk9ySdIhbuCriZ5VuOSL0OaNa8H-kC9a7JHF5s_LuGc3qfoqrUS4Biain-a-tQAGWOdW8-KQnJIvB60nFdzx5vGF76H3nwRocha, Jose Carlos Ferreira da64502430900Instituto de Biologia Molecular do Paraná (IBMP)Universidade Estadual de Ponta Grossa09890213940http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8060249A3&tokenCaptchar=03AGdBq245BsVPMc7BN5agTTzV4pGzlIX9-Jg2al0LkUjdV9Eqp-dhLPyxdfBpy5R1OfxnbbIfIFedYp2lXgoOoBV8VTWSEhFqJaGPmQnIH0_Zs8cf6I9Dh4ST9suzLOhYeo3g63EF2s2d2Of8tgVuUa0xmNzKGUmXE1ToPqWhLu5vFKZlAo5peNYxQCCzS27sbtlcePalaE2kE3EmXmw4YDxYajTx2MZuLh_Pnvj3Iq9lvnoSoqnWeKuUdLaTZvgdxBYMmTqo30cHgU7Vi1DJ1H3zoBbw0qwb_YaU_MK15LXasCJR9-IbQMyqPF17eZjMf6QhlG6yDvWSqAhvB2wWuFH-AABLah6bEXrkdJUTO7o6nOO8Vtk_x1fEDR1b27E2HLTCxtMWLwdMGo0Go1ohq31lGfWKSoaQMHCxEpXfI_-G5Mm0G0KQpadi5b1RzNRsi5GGAtA2E1GhHz8N8Zindq23DEHPoU_CmgSilva, Renann Rodrigues da2021-03-10T11:46:55Z2021-03-092021-03-10T11:46:55Z2020-12-04SILVA, Renann Rodrigues da. Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos. 2021. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2021.http://tede2.uepg.br/jspui/handle/prefix/3320Nas áreas da saúde e agricultura, a identificação bacteriana é essencial para compreender a composição da comunidade microbiana e a sua ecologia. As técnicas de identificação de microrganismos buscam maior precisão, rapidez e menos custo. Uma técnica que vem sendo estudada e amplamente utilizada para a identificação de microrganismos é a identificação através de espectros de massa. Por meio de picos referentes às mais abundantes massas moleculares registradas no espectro, é possível gerar um perfil para reconhecimento de um microrganismo. Outra forma de identificar um espectro de massa, é por meio de picos que são esperados que apareçam no espectro, modelo cujo qual este trabalho fez uso. Para presumir os picos esperados no espectro, foram calculados os pesos moleculares estimados de proteínas ribossomais. Essas proteínas são denominadas house keeping, isto é, são onipresentes e responsáveis pelo funcionamento celular básico. Além de apresentarem em grande abundância no conteúdo procariótico, as proteínas ribossomais são altamente conservadas, não possuindo alteração em sua fisiologia para diferentes meios ou estágios celulares. Os pesos estimados formaram uma base de dados presumida, contendo todas as informações obtidas do repositório do NCBI e foram utilizados somente dados notados como completo, a base de dados criada recebeu o nome de Puchuy e possui 14689 registro. Esta base de dados presumida foi gerada para taxonomia a nível de Domínio, Filo, Classe, Ordem, Família, Gênero e Espécie, e posteriormente submetida à um aprendizado de máquina. Dessa forma, foi possível obter modelos classificatórios de microrganismos baseado em valores de proteínas ribossomais. Foram gerados modelos para cada nível taxonômico, os quais foram utilizados somente os que possuíram melhor desempenho para cada nível. Ainda foi adicionado um algoritmo de agrupamento para o auxílio da classificação. Com os modelos gerados pelo aprendizado de máquina, foi desenvolvido um software, capaz classificar os microrganismos a nível de Filo, Classe, Ordem, Família, Gênero e Espécie. Por fim, foram comparados diferentes classificadores para cada nível taxonômico, com e sem a utilização de um método de agrupamento.In health and agriculture, bacterial identification is essential to understand the composition of the microbial community and its ecology. Microorganism identification techniques seek greater accuracy, speed, and less cost. One technique that has been studied and widely used for the identification of microorganisms is the identification through mass spectra. Through peaks referring to the most abundant molecular masses recorded in the spectrum, it is possible to generate a profile for the recognition of a microorganism. Another way to identify a mass spectrum is through peaks that are expected to appear in the spectrum, the model which this work has made use of. To assume the expected peaks in the spectrum, estimated molecular weights of ribosomal proteins were calculated. These proteins are called housekeeping, that is, they are ubiquitous and responsible for the basic cellular functioning. In addition to their abundant prokaryotic content, ribosomal proteins are highly conserved and do not change their physiology for different cell media or stages. The estimated weights formed a presumed database containing all information obtained from the NCBI repository and only data noted as complete were used, the database created was named Puchuy and has 14689 records. This presumed database was generated for taxonomy at Domain, Phylum, Class, Order, Family, Genus, and Species level, and then subjected to machine learning. Thus, it was possible to obtain classification models of microorganisms based on ribosomal protein values. Models were generated for each taxonomic level, which was used only for those that had better performance for each level. A clustering algorithm was also added to aid classification. With the models generated by the machine learning, the software was developed, able to classify the microorganisms in the Phylum, Class, Order, Family, Genus and Species level. Finally, different classifiers were compared for each taxonomic level, with and without the use of a clustering method.Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2021-03-10T11:46:55Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Renann Rodrigues da Silva.pdf: 2417915 bytes, checksum: 0d767dc440edcf57a88e8eecf9335174 (MD5)Made available in DSpace on 2021-03-10T11:46:55Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Renann Rodrigues da Silva.pdf: 2417915 bytes, checksum: 0d767dc440edcf57a88e8eecf9335174 (MD5) Previous issue date: 2020-12-04Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Estadual de Ponta GrossaPrograma de Pós Graduação Computação AplicadaUEPGBrasilDepartamento de InformáticaAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOProteínas RibossomaisEspectrometria de MassaPesos molecularesAprendizado de MáquinaRibosomal ProteinsMass spectrometryMolecular WeightsMachine LearningClassificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Biblioteca Digital de Teses e Dissertações da UEPGinstname:Universidade Estadual de Ponta Grossa (UEPG)instacron:UEPGLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://tede2.uepg.br/jspui/bitstream/prefix/3320/3/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811http://tede2.uepg.br/jspui/bitstream/prefix/3320/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALRenann Rodrigues da Silva.pdfRenann Rodrigues da Silva.pdfdissertação completa em pdfapplication/pdf2417915http://tede2.uepg.br/jspui/bitstream/prefix/3320/1/Renann%20Rodrigues%20da%20Silva.pdf0d767dc440edcf57a88e8eecf9335174MD51prefix/33202021-03-10 08:46:55.878oai:tede2.uepg.br:prefix/3320TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KBiblioteca Digital de Teses e Dissertaçõeshttps://tede2.uepg.br/jspui/PUBhttp://tede2.uepg.br/oai/requestbicen@uepg.br||mv_fidelis@yahoo.com.bropendoar:2021-03-10T11:46:55Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)false |
dc.title.pt_BR.fl_str_mv |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos |
title |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos |
spellingShingle |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos Silva, Renann Rodrigues da CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Proteínas Ribossomais Espectrometria de Massa Pesos moleculares Aprendizado de Máquina Ribosomal Proteins Mass spectrometry Molecular Weights Machine Learning |
title_short |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos |
title_full |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos |
title_fullStr |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos |
title_full_unstemmed |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos |
title_sort |
Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos |
author |
Silva, Renann Rodrigues da |
author_facet |
Silva, Renann Rodrigues da |
author_role |
author |
dc.contributor.instituicao-banca1.pt_BR.fl_str_mv |
Instituto de Biologia Molecular do Paraná (IBMP) |
dc.contributor.instituicao-banca2.pt_BR.fl_str_mv |
Universidade Estadual de Ponta Grossa |
dc.contributor.advisor1.fl_str_mv |
Etto, Rafael Mazer |
dc.contributor.advisor1ID.fl_str_mv |
27604256813 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AGdBq24O1IqhmGlQkA8-eQTTNvjbNs89imTtKMyCt79v9YL3O0Slk3n8OmPjC7Wg5uI6B3d-9zYqIFerjv046S6NR2pQ6T7rO2kGEwTL7h_tw8wTClhwIQlViJTroGsRV8dCDxTFpc2wYk7j5KubwwwI3h7yBghN7ua-tMcrJzN-vrY640GtYcPmXHHSuh5cRNLVoGReDKuipIpWc7jtsI2QEp2Z4bGSydVBn-ujSJEhCxgiQ6hjXDEVTslHftmYvRzv5NsZI56ouPlvXBGw8unXgB25ZGZvVbj4JKuWBaJjiOjWzSbkrxl7FJco6Yg6T9P79E5jHYawAobra9dItAZ5uojjMk8E5W-MgM60CS1WtR7WCXir_jXD7oftCYupsaauvj5MCUA97foiIO1NK9OXzloGQZHhN5alodhs6ll7gS9Embjc9Uv92ijh3IcHzGYeMvgKM7yZJL6g4tuv78Qi9Ger6Grk_A |
dc.contributor.referee1.fl_str_mv |
Stets, Maria Isabel |
dc.contributor.referee1ID.fl_str_mv |
037.121.669-90 |
dc.contributor.referee1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4189612P9&tokenCaptchar=03AGdBq27U6uN3BEHBndgJhygy1L2etDjZIc8VPX2-Ryx6hkWxZOYt9-uh2R7tHVgwNDgbyClN-buEDmy3oktWOUivyvsqyfOtdq539s0gElN8PFYZgdd_aF8msfdBP3hhzfCAGy1RxZiPF7XKdbeKs1denCpGNCSTVPl3drocaBN-h1GoV3VlLdLz7UKN1RyKMeGFgbvV1iUXI06vb5FpBZ_ijzX-MIlvytHvDVWytcq-XhFYTd5vbTFWI2x1O202gqm7qF770QZ5LMNyBuvVFE_UsDSbt3hx3WKNcTaukd421JoJjwFc2O1MW-uRZw1TWNM6u0_RDgv2tpVrMAKtsS0jOoL6NF3_oSa71DsaKbRks1S_U3mW2Cn9XkRw76Lma1cGgk9ySdIhbuCriZ5VuOSL0OaNa8H-kC9a7JHF5s_LuGc3qfoqrUS4Biain-a-tQAGWOdW8-KQnJIvB60nFdzx5vGF76H3nw |
dc.contributor.referee2.fl_str_mv |
Rocha, Jose Carlos Ferreira da |
dc.contributor.referee2ID.fl_str_mv |
64502430900 |
dc.contributor.authorID.fl_str_mv |
09890213940 |
dc.contributor.authorLattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8060249A3&tokenCaptchar=03AGdBq245BsVPMc7BN5agTTzV4pGzlIX9-Jg2al0LkUjdV9Eqp-dhLPyxdfBpy5R1OfxnbbIfIFedYp2lXgoOoBV8VTWSEhFqJaGPmQnIH0_Zs8cf6I9Dh4ST9suzLOhYeo3g63EF2s2d2Of8tgVuUa0xmNzKGUmXE1ToPqWhLu5vFKZlAo5peNYxQCCzS27sbtlcePalaE2kE3EmXmw4YDxYajTx2MZuLh_Pnvj3Iq9lvnoSoqnWeKuUdLaTZvgdxBYMmTqo30cHgU7Vi1DJ1H3zoBbw0qwb_YaU_MK15LXasCJR9-IbQMyqPF17eZjMf6QhlG6yDvWSqAhvB2wWuFH-AABLah6bEXrkdJUTO7o6nOO8Vtk_x1fEDR1b27E2HLTCxtMWLwdMGo0Go1ohq31lGfWKSoaQMHCxEpXfI_-G5Mm0G0KQpadi5b1RzNRsi5GGAtA2E1GhHz8N8Zindq23DEHPoU_Cmg |
dc.contributor.author.fl_str_mv |
Silva, Renann Rodrigues da |
contributor_str_mv |
Etto, Rafael Mazer Stets, Maria Isabel Rocha, Jose Carlos Ferreira da |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Proteínas Ribossomais Espectrometria de Massa Pesos moleculares Aprendizado de Máquina Ribosomal Proteins Mass spectrometry Molecular Weights Machine Learning |
dc.subject.por.fl_str_mv |
Proteínas Ribossomais Espectrometria de Massa Pesos moleculares Aprendizado de Máquina Ribosomal Proteins Mass spectrometry Molecular Weights Machine Learning |
description |
Nas áreas da saúde e agricultura, a identificação bacteriana é essencial para compreender a composição da comunidade microbiana e a sua ecologia. As técnicas de identificação de microrganismos buscam maior precisão, rapidez e menos custo. Uma técnica que vem sendo estudada e amplamente utilizada para a identificação de microrganismos é a identificação através de espectros de massa. Por meio de picos referentes às mais abundantes massas moleculares registradas no espectro, é possível gerar um perfil para reconhecimento de um microrganismo. Outra forma de identificar um espectro de massa, é por meio de picos que são esperados que apareçam no espectro, modelo cujo qual este trabalho fez uso. Para presumir os picos esperados no espectro, foram calculados os pesos moleculares estimados de proteínas ribossomais. Essas proteínas são denominadas house keeping, isto é, são onipresentes e responsáveis pelo funcionamento celular básico. Além de apresentarem em grande abundância no conteúdo procariótico, as proteínas ribossomais são altamente conservadas, não possuindo alteração em sua fisiologia para diferentes meios ou estágios celulares. Os pesos estimados formaram uma base de dados presumida, contendo todas as informações obtidas do repositório do NCBI e foram utilizados somente dados notados como completo, a base de dados criada recebeu o nome de Puchuy e possui 14689 registro. Esta base de dados presumida foi gerada para taxonomia a nível de Domínio, Filo, Classe, Ordem, Família, Gênero e Espécie, e posteriormente submetida à um aprendizado de máquina. Dessa forma, foi possível obter modelos classificatórios de microrganismos baseado em valores de proteínas ribossomais. Foram gerados modelos para cada nível taxonômico, os quais foram utilizados somente os que possuíram melhor desempenho para cada nível. Ainda foi adicionado um algoritmo de agrupamento para o auxílio da classificação. Com os modelos gerados pelo aprendizado de máquina, foi desenvolvido um software, capaz classificar os microrganismos a nível de Filo, Classe, Ordem, Família, Gênero e Espécie. Por fim, foram comparados diferentes classificadores para cada nível taxonômico, com e sem a utilização de um método de agrupamento. |
publishDate |
2020 |
dc.date.issued.fl_str_mv |
2020-12-04 |
dc.date.accessioned.fl_str_mv |
2021-03-10T11:46:55Z |
dc.date.available.fl_str_mv |
2021-03-09 2021-03-10T11:46:55Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Renann Rodrigues da. Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos. 2021. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2021. |
dc.identifier.uri.fl_str_mv |
http://tede2.uepg.br/jspui/handle/prefix/3320 |
identifier_str_mv |
SILVA, Renann Rodrigues da. Classificação bacteriana baseada em proteínas ribossomais oriundas de dados genômicos. 2021. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2021. |
url |
http://tede2.uepg.br/jspui/handle/prefix/3320 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Estadual de Ponta Grossa |
dc.publisher.program.fl_str_mv |
Programa de Pós Graduação Computação Aplicada |
dc.publisher.initials.fl_str_mv |
UEPG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento de Informática |
publisher.none.fl_str_mv |
Universidade Estadual de Ponta Grossa |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UEPG instname:Universidade Estadual de Ponta Grossa (UEPG) instacron:UEPG |
instname_str |
Universidade Estadual de Ponta Grossa (UEPG) |
instacron_str |
UEPG |
institution |
UEPG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UEPG |
collection |
Biblioteca Digital de Teses e Dissertações da UEPG |
bitstream.url.fl_str_mv |
http://tede2.uepg.br/jspui/bitstream/prefix/3320/3/license.txt http://tede2.uepg.br/jspui/bitstream/prefix/3320/2/license_rdf http://tede2.uepg.br/jspui/bitstream/prefix/3320/1/Renann%20Rodrigues%20da%20Silva.pdf |
bitstream.checksum.fl_str_mv |
43cd690d6a359e86c1fe3d5b7cba0c9b e39d27027a6cc9cb039ad269a5db8e34 0d767dc440edcf57a88e8eecf9335174 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG) |
repository.mail.fl_str_mv |
bicen@uepg.br||mv_fidelis@yahoo.com.br |
_version_ |
1809460471554637824 |