Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF

Detalhes bibliográficos
Autor(a) principal: Oyama, Luiz Otávio
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UEPG
Texto Completo: http://tede2.uepg.br/jspui/handle/prefix/4059
Resumo: A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos.
id UEPG_8f16127b08ddbcd74ed9a9912a4b210f
oai_identifier_str oai:tede2.uepg.br:prefix/4059
network_acronym_str UEPG
network_name_str Biblioteca Digital de Teses e Dissertações da UEPG
repository_id_str
spelling Etto, Rafael Mazerhttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AFcWeA7LmJ5pESWmUi1z8d4d6HQn38rrwmjk_TVamm0fLXzO52LPdB6WA9A1fiul5yTTymlD4qvdbsPPgfhT8N7qZsW3M_CfSfM--LytgN_-EWY1j2CQ5cptxbXVMTd9Gums7wQTGzZPSYJ5vZkDCpGXdV4Y5geS7Q7XBHBwdccAcyMkWO-ybCANwqL8_NV-hXfk2H5w49OLjKBJReeL2cSZR06CHmvrjtyJ0mTHNb6rgzXXf7oGGlI-DHrAmIgA16XlUVgRx-Hz0JzZZ7-F1xb7rJwnnQd4iZorYEMa7l1pXx7DBTUjNgP4F5zBnscNjSAXJonGNUyFPisa3w1RsIelfJZY867eIQ9oI8M4WlO7CTwqYgXJfWxNAbQxXVxf-xMKG4C63pm4-PFHX3r0WsAsiIup0ODwxGsJ2kf_UTIyq8kGzsEsQ9yWVc_C4bHl--wGy0mOlQrPtyJ_wGCetZR5OzqvfWz02kMn2oSu34hgVBzGQ2VHavbdI-POEuFE0NiSq-fW1s_FyYnukymwfr4I55-w1p9kU8Fv24103XSgdls5iMJBNHb52EXVNxk1mJqmycFVa8-6esIoPn544Wih7SnNBkfA7gRocha, José Carlos Ferreira dahttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4703018J8&tokenCaptchar=03AFcWeA4DXsX7wcQEcIWYmzGP5JEkIge5fRkASJa7EfvHaNSgoUdx_YfvDR7ybAzPIQMyXXfm_1y5b6SPkn69k__fR62rZVD7zgI8dcp6UppWYurb4NwgUZPdX3SxvSerwj6Tl5S5UcWbPH1UabOYKcVB8gboXS_2Bw72G_NaYrYUGTGIBzA3qSMJtR-rZbil4Hwc5fSOba8lp2TANsBrQa8hX5toVhY7iY51wm2hJgkzSGXr5sJNx22qBkKSAKbUbUPeGxDl6P7I1iMSOOC9Xaj3crIAKEFb5J2Cyks71Xnvl06ZIXAz3Ljxsjm7vfUfc9ITNLeDcicmWfb-eTWFWjErnFW6RyXWrTUhfC2SnB3P_xgZzso16Bph46qYXDKnPcnbmpL3L7WSNj9InGtM9IL4ou6YdpQRF2zw5KEqGrLlL5npe57U-o9h6SXrx2brDvPo6QrRhyfJ4Ua8zIH7GI8b9BjrVxP-4-KszPcUlOG0hyFesFvai5UcJZkpEw4a4sqMighTLkkPvexxpgbBTzo_Gm7vK7xllOjTG7IR3HqAOtMYumUC3Jx-aCD8i7ISBEueHtIOc0bcN34sFkJKMoDA24jTFE36fgLeite, Wellington Claitonhttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4592142U9&tokenCaptchar=03AFcWeA4kbAweXwqrTVTuzslW_DgsvEiXdCAQ9_liRY17AkLf2JJSwoMylk1dmMLuGLlrQSb8p2Ewy8pqFpUKwo3lxchPzQfrYh-vtRa12wBPoU-lNxr0HqD-CBdYaodwHpggn8o_QDA6xg2x5nJOjp0V1lg0bUCTiN5a3xbOpHbrpYwOcgbVjDr4GOAmKjVixEVX3Gj-H6VIvcH1P0OhY2CvoXJatHXZ7ZoLxz9rloapEv2ibVQzuuyHBqe6VCn0Xj8ch2jgdZJc6koVf_ET-Jq1b7dpx1jPkdmJT8rfgpJojRs3J4b74ee7HZcWNXrmGIq9hYKKZzOJ1aCGZD7RoZuvh3mdmAtq1-Y_fl-dBpsViR6-F5gU91pwd1CG4bqp5b2cLKsX3mKAcQhm4Qqi4hVVVjUXHCTo2jXwpvVfKsq7RTI1rz9TD5rOGbZ2PEncVwn633sgtFsAtTE5Khd9ihevvzosL32cs69_e5HnEABhG4UjvfhJXE_hxDfAeZdqTkxU8UbUro91Gunt_W60HoOGDYcUWX1Gx-8duc0SFH0q5XuRexXC1nhvbeh2S0OQMvK7qlDbwXroh8N5Q8Lq9DM8e_TuIEJRlghttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8612777E3&tokenCaptchar=03AFcWeA52Bb9rTltTCqLndu1wcoHUpR1tRM7qfe1QiPbc3LT3j8mO3BjMnn5FRUrdGFWgTgW57FMmZh-YFWLGvCkzy5u9J-Oe_yFRegPrg7ir1MMW2VfZ-MTsbcVMPIu2GKZp2aEgxoxstto8tzzeYeFNeNIbz-7yCDoHIC2_jdytfDu_9UK3xBTFEmRl4tI0bezcUrsJIqCkDJIZt0BN7xYgdsW-dNoZ8WiHHk72xDRAKkHkCnnD2YI4IbSbbxDW0eHx57x0ATA6tY6YOJ_0M1cE1yqofhDdX7OqT2Ktn5N_bEt92SzvZflq1lebr4tBzgAZH9-tS_SU2OulwcgjcQO5-fSKBSCZ12BzLhq2gr0isKU3hq_Vs6IWq2gEj2UlcHkrp17qrKWHIum-jWWCs3DDqpdnRJoLPyNioVkIEnZ8E06TDxnBp0Jlb5UhocMiUUAUXmwSVQA6Dx11Nom9yQPukdsGEZmGX9dqG7svpB5nNWne9DUDih0eNQ2LOa5Iheq6yfH3GZ5VCwNbsap8Tda-jWITNxF1FbYEPrMcpHBowInGOpA4JtxEwufSUHl80fOKisAuom_vOyama, Luiz Otávio2023-11-06T17:15:00Z2023-11-062023-11-06T17:15:00Z2023-08-30OYAMA, Luiz Otávio. Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023.http://tede2.uepg.br/jspui/handle/prefix/4059A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos.Bacterial identification is a topic of great standard in the field of agriculture for the understanding of soil microbiology, especially the rhizosphere. Among all techniques for identifying microorganisms, Mass Spectrometry MALDI-TOF type has been extensively adopted as a more economical and effective alternative than traditional methods, due to its phenotypic characteristics. This method facilitates microorganism identification, as each microorganism possesses a distinct mass spectrum profile. Within the produced mass spectrum, specific biomarkers can be assigned and utilized as criteria for sample classification. Ribosomal proteins are examples of biomarkers poised for bacterial identification, given their roles in cellular maintenance and their remarkable conservation in amino acid sequences. The Ribopeaks bacterial classifier uses molecular mass data from ribosomal proteins for organism identification. However, mass spectra data obtained from whole bacterial might include peaks associated with non-ribosomal proteins, peptides, metabolites, and lipids within their distinctive patterns, creating challenges for accurate classification. In this study, a clustering approach was employed, utilizing the DBSCAN algorithm, to cluster ribosomal proteins regardless of their specific types. This approach aimed to create a filter capable of determining the compatibility of a given macromolecule mass with a ribosomal protein. For construction of the models, the Puchuy base of presumed masses of ribosomal proteins was used, which went through a pre-processing step before being submitted to machine learning. A controller for multiple bacterial classifications in Ribopeaks was built to enable the validation of the generated models, sending the organisms from the real SpectraBank database to the classifier before and after filtering the peaks. In the best case, the filter was able to subtly increase the assertiveness of the bacterial classifier, with an average reduction of 40.1% in the peak volume of the bacterial sample and a reduction of 35.66% in the processing time for classification of the same organisms.Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2023-11-06T17:15:00Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Luiz Otávio Oyama .pdf: 3438663 bytes, checksum: 9bfbb59d218f5c1f8b592b0e237e015c (MD5)Made available in DSpace on 2023-11-06T17:15:00Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Luiz Otávio Oyama .pdf: 3438663 bytes, checksum: 9bfbb59d218f5c1f8b592b0e237e015c (MD5) Previous issue date: 2023-08-30porUniversidade Estadual de Ponta GrossaPrograma de Pós Graduação Computação AplicadaUEPGBrasilDepartamento de InformáticaAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de MáquinaBioinformáticaBiotecnologiaEspectrometria de MassaMachine LearningBioinformaticsBiotechnologyMass SpectrometryDesenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOFinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Biblioteca Digital de Teses e Dissertações da UEPGinstname:Universidade Estadual de Ponta Grossa (UEPG)instacron:UEPGLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://tede2.uepg.br/jspui/bitstream/prefix/4059/3/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811http://tede2.uepg.br/jspui/bitstream/prefix/4059/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALLuiz Otávio Oyama .pdfLuiz Otávio Oyama .pdfdissertação completa em pdfapplication/pdf3438663http://tede2.uepg.br/jspui/bitstream/prefix/4059/1/Luiz%20Ot%c3%a1vio%20Oyama%20.pdf9bfbb59d218f5c1f8b592b0e237e015cMD51prefix/40592023-11-06 15:15:00.839oai:tede2.uepg.br:prefix/4059TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KBiblioteca Digital de Teses e Dissertaçõeshttps://tede2.uepg.br/jspui/PUBhttp://tede2.uepg.br/oai/requestbicen@uepg.br||mv_fidelis@yahoo.com.bropendoar:2023-11-06T17:15Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
title Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
spellingShingle Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
Oyama, Luiz Otávio
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado de Máquina
Bioinformática
Biotecnologia
Espectrometria de Massa
Machine Learning
Bioinformatics
Biotechnology
Mass Spectrometry
title_short Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
title_full Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
title_fullStr Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
title_full_unstemmed Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
title_sort Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
author Oyama, Luiz Otávio
author_facet Oyama, Luiz Otávio
author_role author
dc.contributor.advisor1.fl_str_mv Etto, Rafael Mazer
dc.contributor.advisor1Lattes.fl_str_mv https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AFcWeA7LmJ5pESWmUi1z8d4d6HQn38rrwmjk_TVamm0fLXzO52LPdB6WA9A1fiul5yTTymlD4qvdbsPPgfhT8N7qZsW3M_CfSfM--LytgN_-EWY1j2CQ5cptxbXVMTd9Gums7wQTGzZPSYJ5vZkDCpGXdV4Y5geS7Q7XBHBwdccAcyMkWO-ybCANwqL8_NV-hXfk2H5w49OLjKBJReeL2cSZR06CHmvrjtyJ0mTHNb6rgzXXf7oGGlI-DHrAmIgA16XlUVgRx-Hz0JzZZ7-F1xb7rJwnnQd4iZorYEMa7l1pXx7DBTUjNgP4F5zBnscNjSAXJonGNUyFPisa3w1RsIelfJZY867eIQ9oI8M4WlO7CTwqYgXJfWxNAbQxXVxf-xMKG4C63pm4-PFHX3r0WsAsiIup0ODwxGsJ2kf_UTIyq8kGzsEsQ9yWVc_C4bHl--wGy0mOlQrPtyJ_wGCetZR5OzqvfWz02kMn2oSu34hgVBzGQ2VHavbdI-POEuFE0NiSq-fW1s_FyYnukymwfr4I55-w1p9kU8Fv24103XSgdls5iMJBNHb52EXVNxk1mJqmycFVa8-6esIoPn544Wih7SnNBkfA7g
dc.contributor.referee1.fl_str_mv Rocha, José Carlos Ferreira da
dc.contributor.referee1Lattes.fl_str_mv https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4703018J8&tokenCaptchar=03AFcWeA4DXsX7wcQEcIWYmzGP5JEkIge5fRkASJa7EfvHaNSgoUdx_YfvDR7ybAzPIQMyXXfm_1y5b6SPkn69k__fR62rZVD7zgI8dcp6UppWYurb4NwgUZPdX3SxvSerwj6Tl5S5UcWbPH1UabOYKcVB8gboXS_2Bw72G_NaYrYUGTGIBzA3qSMJtR-rZbil4Hwc5fSOba8lp2TANsBrQa8hX5toVhY7iY51wm2hJgkzSGXr5sJNx22qBkKSAKbUbUPeGxDl6P7I1iMSOOC9Xaj3crIAKEFb5J2Cyks71Xnvl06ZIXAz3Ljxsjm7vfUfc9ITNLeDcicmWfb-eTWFWjErnFW6RyXWrTUhfC2SnB3P_xgZzso16Bph46qYXDKnPcnbmpL3L7WSNj9InGtM9IL4ou6YdpQRF2zw5KEqGrLlL5npe57U-o9h6SXrx2brDvPo6QrRhyfJ4Ua8zIH7GI8b9BjrVxP-4-KszPcUlOG0hyFesFvai5UcJZkpEw4a4sqMighTLkkPvexxpgbBTzo_Gm7vK7xllOjTG7IR3HqAOtMYumUC3Jx-aCD8i7ISBEueHtIOc0bcN34sFkJKMoDA24jTFE36fg
dc.contributor.referee2.fl_str_mv Leite, Wellington Claiton
dc.contributor.referee2Lattes.fl_str_mv https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4592142U9&tokenCaptchar=03AFcWeA4kbAweXwqrTVTuzslW_DgsvEiXdCAQ9_liRY17AkLf2JJSwoMylk1dmMLuGLlrQSb8p2Ewy8pqFpUKwo3lxchPzQfrYh-vtRa12wBPoU-lNxr0HqD-CBdYaodwHpggn8o_QDA6xg2x5nJOjp0V1lg0bUCTiN5a3xbOpHbrpYwOcgbVjDr4GOAmKjVixEVX3Gj-H6VIvcH1P0OhY2CvoXJatHXZ7ZoLxz9rloapEv2ibVQzuuyHBqe6VCn0Xj8ch2jgdZJc6koVf_ET-Jq1b7dpx1jPkdmJT8rfgpJojRs3J4b74ee7HZcWNXrmGIq9hYKKZzOJ1aCGZD7RoZuvh3mdmAtq1-Y_fl-dBpsViR6-F5gU91pwd1CG4bqp5b2cLKsX3mKAcQhm4Qqi4hVVVjUXHCTo2jXwpvVfKsq7RTI1rz9TD5rOGbZ2PEncVwn633sgtFsAtTE5Khd9ihevvzosL32cs69_e5HnEABhG4UjvfhJXE_hxDfAeZdqTkxU8UbUro91Gunt_W60HoOGDYcUWX1Gx-8duc0SFH0q5XuRexXC1nhvbeh2S0OQMvK7qlDbwXroh8N5Q8Lq9DM8e_TuIEJRlg
dc.contributor.authorLattes.fl_str_mv https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8612777E3&tokenCaptchar=03AFcWeA52Bb9rTltTCqLndu1wcoHUpR1tRM7qfe1QiPbc3LT3j8mO3BjMnn5FRUrdGFWgTgW57FMmZh-YFWLGvCkzy5u9J-Oe_yFRegPrg7ir1MMW2VfZ-MTsbcVMPIu2GKZp2aEgxoxstto8tzzeYeFNeNIbz-7yCDoHIC2_jdytfDu_9UK3xBTFEmRl4tI0bezcUrsJIqCkDJIZt0BN7xYgdsW-dNoZ8WiHHk72xDRAKkHkCnnD2YI4IbSbbxDW0eHx57x0ATA6tY6YOJ_0M1cE1yqofhDdX7OqT2Ktn5N_bEt92SzvZflq1lebr4tBzgAZH9-tS_SU2OulwcgjcQO5-fSKBSCZ12BzLhq2gr0isKU3hq_Vs6IWq2gEj2UlcHkrp17qrKWHIum-jWWCs3DDqpdnRJoLPyNioVkIEnZ8E06TDxnBp0Jlb5UhocMiUUAUXmwSVQA6Dx11Nom9yQPukdsGEZmGX9dqG7svpB5nNWne9DUDih0eNQ2LOa5Iheq6yfH3GZ5VCwNbsap8Tda-jWITNxF1FbYEPrMcpHBowInGOpA4JtxEwufSUHl80fOKisAuom_v
dc.contributor.author.fl_str_mv Oyama, Luiz Otávio
contributor_str_mv Etto, Rafael Mazer
Rocha, José Carlos Ferreira da
Leite, Wellington Claiton
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado de Máquina
Bioinformática
Biotecnologia
Espectrometria de Massa
Machine Learning
Bioinformatics
Biotechnology
Mass Spectrometry
dc.subject.por.fl_str_mv Aprendizado de Máquina
Bioinformática
Biotecnologia
Espectrometria de Massa
Machine Learning
Bioinformatics
Biotechnology
Mass Spectrometry
description A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-11-06T17:15:00Z
dc.date.available.fl_str_mv 2023-11-06
2023-11-06T17:15:00Z
dc.date.issued.fl_str_mv 2023-08-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv OYAMA, Luiz Otávio. Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023.
dc.identifier.uri.fl_str_mv http://tede2.uepg.br/jspui/handle/prefix/4059
identifier_str_mv OYAMA, Luiz Otávio. Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023.
url http://tede2.uepg.br/jspui/handle/prefix/4059
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Estadual de Ponta Grossa
dc.publisher.program.fl_str_mv Programa de Pós Graduação Computação Aplicada
dc.publisher.initials.fl_str_mv UEPG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento de Informática
publisher.none.fl_str_mv Universidade Estadual de Ponta Grossa
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UEPG
instname:Universidade Estadual de Ponta Grossa (UEPG)
instacron:UEPG
instname_str Universidade Estadual de Ponta Grossa (UEPG)
instacron_str UEPG
institution UEPG
reponame_str Biblioteca Digital de Teses e Dissertações da UEPG
collection Biblioteca Digital de Teses e Dissertações da UEPG
bitstream.url.fl_str_mv http://tede2.uepg.br/jspui/bitstream/prefix/4059/3/license.txt
http://tede2.uepg.br/jspui/bitstream/prefix/4059/2/license_rdf
http://tede2.uepg.br/jspui/bitstream/prefix/4059/1/Luiz%20Ot%c3%a1vio%20Oyama%20.pdf
bitstream.checksum.fl_str_mv 43cd690d6a359e86c1fe3d5b7cba0c9b
e39d27027a6cc9cb039ad269a5db8e34
9bfbb59d218f5c1f8b592b0e237e015c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)
repository.mail.fl_str_mv bicen@uepg.br||mv_fidelis@yahoo.com.br
_version_ 1809460482207121408