Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UEPG |
Texto Completo: | http://tede2.uepg.br/jspui/handle/prefix/4059 |
Resumo: | A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos. |
id |
UEPG_8f16127b08ddbcd74ed9a9912a4b210f |
---|---|
oai_identifier_str |
oai:tede2.uepg.br:prefix/4059 |
network_acronym_str |
UEPG |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UEPG |
repository_id_str |
|
spelling |
Etto, Rafael Mazerhttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AFcWeA7LmJ5pESWmUi1z8d4d6HQn38rrwmjk_TVamm0fLXzO52LPdB6WA9A1fiul5yTTymlD4qvdbsPPgfhT8N7qZsW3M_CfSfM--LytgN_-EWY1j2CQ5cptxbXVMTd9Gums7wQTGzZPSYJ5vZkDCpGXdV4Y5geS7Q7XBHBwdccAcyMkWO-ybCANwqL8_NV-hXfk2H5w49OLjKBJReeL2cSZR06CHmvrjtyJ0mTHNb6rgzXXf7oGGlI-DHrAmIgA16XlUVgRx-Hz0JzZZ7-F1xb7rJwnnQd4iZorYEMa7l1pXx7DBTUjNgP4F5zBnscNjSAXJonGNUyFPisa3w1RsIelfJZY867eIQ9oI8M4WlO7CTwqYgXJfWxNAbQxXVxf-xMKG4C63pm4-PFHX3r0WsAsiIup0ODwxGsJ2kf_UTIyq8kGzsEsQ9yWVc_C4bHl--wGy0mOlQrPtyJ_wGCetZR5OzqvfWz02kMn2oSu34hgVBzGQ2VHavbdI-POEuFE0NiSq-fW1s_FyYnukymwfr4I55-w1p9kU8Fv24103XSgdls5iMJBNHb52EXVNxk1mJqmycFVa8-6esIoPn544Wih7SnNBkfA7gRocha, José Carlos Ferreira dahttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4703018J8&tokenCaptchar=03AFcWeA4DXsX7wcQEcIWYmzGP5JEkIge5fRkASJa7EfvHaNSgoUdx_YfvDR7ybAzPIQMyXXfm_1y5b6SPkn69k__fR62rZVD7zgI8dcp6UppWYurb4NwgUZPdX3SxvSerwj6Tl5S5UcWbPH1UabOYKcVB8gboXS_2Bw72G_NaYrYUGTGIBzA3qSMJtR-rZbil4Hwc5fSOba8lp2TANsBrQa8hX5toVhY7iY51wm2hJgkzSGXr5sJNx22qBkKSAKbUbUPeGxDl6P7I1iMSOOC9Xaj3crIAKEFb5J2Cyks71Xnvl06ZIXAz3Ljxsjm7vfUfc9ITNLeDcicmWfb-eTWFWjErnFW6RyXWrTUhfC2SnB3P_xgZzso16Bph46qYXDKnPcnbmpL3L7WSNj9InGtM9IL4ou6YdpQRF2zw5KEqGrLlL5npe57U-o9h6SXrx2brDvPo6QrRhyfJ4Ua8zIH7GI8b9BjrVxP-4-KszPcUlOG0hyFesFvai5UcJZkpEw4a4sqMighTLkkPvexxpgbBTzo_Gm7vK7xllOjTG7IR3HqAOtMYumUC3Jx-aCD8i7ISBEueHtIOc0bcN34sFkJKMoDA24jTFE36fgLeite, Wellington Claitonhttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4592142U9&tokenCaptchar=03AFcWeA4kbAweXwqrTVTuzslW_DgsvEiXdCAQ9_liRY17AkLf2JJSwoMylk1dmMLuGLlrQSb8p2Ewy8pqFpUKwo3lxchPzQfrYh-vtRa12wBPoU-lNxr0HqD-CBdYaodwHpggn8o_QDA6xg2x5nJOjp0V1lg0bUCTiN5a3xbOpHbrpYwOcgbVjDr4GOAmKjVixEVX3Gj-H6VIvcH1P0OhY2CvoXJatHXZ7ZoLxz9rloapEv2ibVQzuuyHBqe6VCn0Xj8ch2jgdZJc6koVf_ET-Jq1b7dpx1jPkdmJT8rfgpJojRs3J4b74ee7HZcWNXrmGIq9hYKKZzOJ1aCGZD7RoZuvh3mdmAtq1-Y_fl-dBpsViR6-F5gU91pwd1CG4bqp5b2cLKsX3mKAcQhm4Qqi4hVVVjUXHCTo2jXwpvVfKsq7RTI1rz9TD5rOGbZ2PEncVwn633sgtFsAtTE5Khd9ihevvzosL32cs69_e5HnEABhG4UjvfhJXE_hxDfAeZdqTkxU8UbUro91Gunt_W60HoOGDYcUWX1Gx-8duc0SFH0q5XuRexXC1nhvbeh2S0OQMvK7qlDbwXroh8N5Q8Lq9DM8e_TuIEJRlghttps://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8612777E3&tokenCaptchar=03AFcWeA52Bb9rTltTCqLndu1wcoHUpR1tRM7qfe1QiPbc3LT3j8mO3BjMnn5FRUrdGFWgTgW57FMmZh-YFWLGvCkzy5u9J-Oe_yFRegPrg7ir1MMW2VfZ-MTsbcVMPIu2GKZp2aEgxoxstto8tzzeYeFNeNIbz-7yCDoHIC2_jdytfDu_9UK3xBTFEmRl4tI0bezcUrsJIqCkDJIZt0BN7xYgdsW-dNoZ8WiHHk72xDRAKkHkCnnD2YI4IbSbbxDW0eHx57x0ATA6tY6YOJ_0M1cE1yqofhDdX7OqT2Ktn5N_bEt92SzvZflq1lebr4tBzgAZH9-tS_SU2OulwcgjcQO5-fSKBSCZ12BzLhq2gr0isKU3hq_Vs6IWq2gEj2UlcHkrp17qrKWHIum-jWWCs3DDqpdnRJoLPyNioVkIEnZ8E06TDxnBp0Jlb5UhocMiUUAUXmwSVQA6Dx11Nom9yQPukdsGEZmGX9dqG7svpB5nNWne9DUDih0eNQ2LOa5Iheq6yfH3GZ5VCwNbsap8Tda-jWITNxF1FbYEPrMcpHBowInGOpA4JtxEwufSUHl80fOKisAuom_vOyama, Luiz Otávio2023-11-06T17:15:00Z2023-11-062023-11-06T17:15:00Z2023-08-30OYAMA, Luiz Otávio. Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023.http://tede2.uepg.br/jspui/handle/prefix/4059A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos.Bacterial identification is a topic of great standard in the field of agriculture for the understanding of soil microbiology, especially the rhizosphere. Among all techniques for identifying microorganisms, Mass Spectrometry MALDI-TOF type has been extensively adopted as a more economical and effective alternative than traditional methods, due to its phenotypic characteristics. This method facilitates microorganism identification, as each microorganism possesses a distinct mass spectrum profile. Within the produced mass spectrum, specific biomarkers can be assigned and utilized as criteria for sample classification. Ribosomal proteins are examples of biomarkers poised for bacterial identification, given their roles in cellular maintenance and their remarkable conservation in amino acid sequences. The Ribopeaks bacterial classifier uses molecular mass data from ribosomal proteins for organism identification. However, mass spectra data obtained from whole bacterial might include peaks associated with non-ribosomal proteins, peptides, metabolites, and lipids within their distinctive patterns, creating challenges for accurate classification. In this study, a clustering approach was employed, utilizing the DBSCAN algorithm, to cluster ribosomal proteins regardless of their specific types. This approach aimed to create a filter capable of determining the compatibility of a given macromolecule mass with a ribosomal protein. For construction of the models, the Puchuy base of presumed masses of ribosomal proteins was used, which went through a pre-processing step before being submitted to machine learning. A controller for multiple bacterial classifications in Ribopeaks was built to enable the validation of the generated models, sending the organisms from the real SpectraBank database to the classifier before and after filtering the peaks. In the best case, the filter was able to subtly increase the assertiveness of the bacterial classifier, with an average reduction of 40.1% in the peak volume of the bacterial sample and a reduction of 35.66% in the processing time for classification of the same organisms.Submitted by Angela Maria de Oliveira (amolivei@uepg.br) on 2023-11-06T17:15:00Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Luiz Otávio Oyama .pdf: 3438663 bytes, checksum: 9bfbb59d218f5c1f8b592b0e237e015c (MD5)Made available in DSpace on 2023-11-06T17:15:00Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) Luiz Otávio Oyama .pdf: 3438663 bytes, checksum: 9bfbb59d218f5c1f8b592b0e237e015c (MD5) Previous issue date: 2023-08-30porUniversidade Estadual de Ponta GrossaPrograma de Pós Graduação Computação AplicadaUEPGBrasilDepartamento de InformáticaAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de MáquinaBioinformáticaBiotecnologiaEspectrometria de MassaMachine LearningBioinformaticsBiotechnologyMass SpectrometryDesenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOFinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Biblioteca Digital de Teses e Dissertações da UEPGinstname:Universidade Estadual de Ponta Grossa (UEPG)instacron:UEPGLICENSElicense.txtlicense.txttext/plain; charset=utf-81866http://tede2.uepg.br/jspui/bitstream/prefix/4059/3/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811http://tede2.uepg.br/jspui/bitstream/prefix/4059/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALLuiz Otávio Oyama .pdfLuiz Otávio Oyama .pdfdissertação completa em pdfapplication/pdf3438663http://tede2.uepg.br/jspui/bitstream/prefix/4059/1/Luiz%20Ot%c3%a1vio%20Oyama%20.pdf9bfbb59d218f5c1f8b592b0e237e015cMD51prefix/40592023-11-06 15:15:00.839oai:tede2.uepg.br:prefix/4059TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KBiblioteca Digital de Teses e Dissertaçõeshttps://tede2.uepg.br/jspui/PUBhttp://tede2.uepg.br/oai/requestbicen@uepg.br||mv_fidelis@yahoo.com.bropendoar:2023-11-06T17:15Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF |
title |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF |
spellingShingle |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF Oyama, Luiz Otávio CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de Máquina Bioinformática Biotecnologia Espectrometria de Massa Machine Learning Bioinformatics Biotechnology Mass Spectrometry |
title_short |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF |
title_full |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF |
title_fullStr |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF |
title_full_unstemmed |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF |
title_sort |
Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF |
author |
Oyama, Luiz Otávio |
author_facet |
Oyama, Luiz Otávio |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Etto, Rafael Mazer |
dc.contributor.advisor1Lattes.fl_str_mv |
https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4704988T6&tokenCaptchar=03AFcWeA7LmJ5pESWmUi1z8d4d6HQn38rrwmjk_TVamm0fLXzO52LPdB6WA9A1fiul5yTTymlD4qvdbsPPgfhT8N7qZsW3M_CfSfM--LytgN_-EWY1j2CQ5cptxbXVMTd9Gums7wQTGzZPSYJ5vZkDCpGXdV4Y5geS7Q7XBHBwdccAcyMkWO-ybCANwqL8_NV-hXfk2H5w49OLjKBJReeL2cSZR06CHmvrjtyJ0mTHNb6rgzXXf7oGGlI-DHrAmIgA16XlUVgRx-Hz0JzZZ7-F1xb7rJwnnQd4iZorYEMa7l1pXx7DBTUjNgP4F5zBnscNjSAXJonGNUyFPisa3w1RsIelfJZY867eIQ9oI8M4WlO7CTwqYgXJfWxNAbQxXVxf-xMKG4C63pm4-PFHX3r0WsAsiIup0ODwxGsJ2kf_UTIyq8kGzsEsQ9yWVc_C4bHl--wGy0mOlQrPtyJ_wGCetZR5OzqvfWz02kMn2oSu34hgVBzGQ2VHavbdI-POEuFE0NiSq-fW1s_FyYnukymwfr4I55-w1p9kU8Fv24103XSgdls5iMJBNHb52EXVNxk1mJqmycFVa8-6esIoPn544Wih7SnNBkfA7g |
dc.contributor.referee1.fl_str_mv |
Rocha, José Carlos Ferreira da |
dc.contributor.referee1Lattes.fl_str_mv |
https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4703018J8&tokenCaptchar=03AFcWeA4DXsX7wcQEcIWYmzGP5JEkIge5fRkASJa7EfvHaNSgoUdx_YfvDR7ybAzPIQMyXXfm_1y5b6SPkn69k__fR62rZVD7zgI8dcp6UppWYurb4NwgUZPdX3SxvSerwj6Tl5S5UcWbPH1UabOYKcVB8gboXS_2Bw72G_NaYrYUGTGIBzA3qSMJtR-rZbil4Hwc5fSOba8lp2TANsBrQa8hX5toVhY7iY51wm2hJgkzSGXr5sJNx22qBkKSAKbUbUPeGxDl6P7I1iMSOOC9Xaj3crIAKEFb5J2Cyks71Xnvl06ZIXAz3Ljxsjm7vfUfc9ITNLeDcicmWfb-eTWFWjErnFW6RyXWrTUhfC2SnB3P_xgZzso16Bph46qYXDKnPcnbmpL3L7WSNj9InGtM9IL4ou6YdpQRF2zw5KEqGrLlL5npe57U-o9h6SXrx2brDvPo6QrRhyfJ4Ua8zIH7GI8b9BjrVxP-4-KszPcUlOG0hyFesFvai5UcJZkpEw4a4sqMighTLkkPvexxpgbBTzo_Gm7vK7xllOjTG7IR3HqAOtMYumUC3Jx-aCD8i7ISBEueHtIOc0bcN34sFkJKMoDA24jTFE36fg |
dc.contributor.referee2.fl_str_mv |
Leite, Wellington Claiton |
dc.contributor.referee2Lattes.fl_str_mv |
https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4592142U9&tokenCaptchar=03AFcWeA4kbAweXwqrTVTuzslW_DgsvEiXdCAQ9_liRY17AkLf2JJSwoMylk1dmMLuGLlrQSb8p2Ewy8pqFpUKwo3lxchPzQfrYh-vtRa12wBPoU-lNxr0HqD-CBdYaodwHpggn8o_QDA6xg2x5nJOjp0V1lg0bUCTiN5a3xbOpHbrpYwOcgbVjDr4GOAmKjVixEVX3Gj-H6VIvcH1P0OhY2CvoXJatHXZ7ZoLxz9rloapEv2ibVQzuuyHBqe6VCn0Xj8ch2jgdZJc6koVf_ET-Jq1b7dpx1jPkdmJT8rfgpJojRs3J4b74ee7HZcWNXrmGIq9hYKKZzOJ1aCGZD7RoZuvh3mdmAtq1-Y_fl-dBpsViR6-F5gU91pwd1CG4bqp5b2cLKsX3mKAcQhm4Qqi4hVVVjUXHCTo2jXwpvVfKsq7RTI1rz9TD5rOGbZ2PEncVwn633sgtFsAtTE5Khd9ihevvzosL32cs69_e5HnEABhG4UjvfhJXE_hxDfAeZdqTkxU8UbUro91Gunt_W60HoOGDYcUWX1Gx-8duc0SFH0q5XuRexXC1nhvbeh2S0OQMvK7qlDbwXroh8N5Q8Lq9DM8e_TuIEJRlg |
dc.contributor.authorLattes.fl_str_mv |
https://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K8612777E3&tokenCaptchar=03AFcWeA52Bb9rTltTCqLndu1wcoHUpR1tRM7qfe1QiPbc3LT3j8mO3BjMnn5FRUrdGFWgTgW57FMmZh-YFWLGvCkzy5u9J-Oe_yFRegPrg7ir1MMW2VfZ-MTsbcVMPIu2GKZp2aEgxoxstto8tzzeYeFNeNIbz-7yCDoHIC2_jdytfDu_9UK3xBTFEmRl4tI0bezcUrsJIqCkDJIZt0BN7xYgdsW-dNoZ8WiHHk72xDRAKkHkCnnD2YI4IbSbbxDW0eHx57x0ATA6tY6YOJ_0M1cE1yqofhDdX7OqT2Ktn5N_bEt92SzvZflq1lebr4tBzgAZH9-tS_SU2OulwcgjcQO5-fSKBSCZ12BzLhq2gr0isKU3hq_Vs6IWq2gEj2UlcHkrp17qrKWHIum-jWWCs3DDqpdnRJoLPyNioVkIEnZ8E06TDxnBp0Jlb5UhocMiUUAUXmwSVQA6Dx11Nom9yQPukdsGEZmGX9dqG7svpB5nNWne9DUDih0eNQ2LOa5Iheq6yfH3GZ5VCwNbsap8Tda-jWITNxF1FbYEPrMcpHBowInGOpA4JtxEwufSUHl80fOKisAuom_v |
dc.contributor.author.fl_str_mv |
Oyama, Luiz Otávio |
contributor_str_mv |
Etto, Rafael Mazer Rocha, José Carlos Ferreira da Leite, Wellington Claiton |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de Máquina Bioinformática Biotecnologia Espectrometria de Massa Machine Learning Bioinformatics Biotechnology Mass Spectrometry |
dc.subject.por.fl_str_mv |
Aprendizado de Máquina Bioinformática Biotecnologia Espectrometria de Massa Machine Learning Bioinformatics Biotechnology Mass Spectrometry |
description |
A identificação bacteriana é um tema de grande relevância no campo da agricultura para a compreensão da microbiologia do solo, sobretudo, a rizosfera. Entre as técnicas de identificação de microrganismos, a Espectrometria de Massa do tipo MALDI-TOF, do inglês Matrix-Assisted Laser Desorption/Ionization Time-of-Flight, tem sido extensivamente adotada como alternativa mais econômica e eficaz do que os métodos tradicionais, baseados em características fenotípicas. Este método permite a identificação de um microrganismo, pois cada microrganismo terá um perfil de espectro de massa único. No espectro de massa gerado, biomarcadores podem ser assinalados e utilizados como critério de classificação das amostras. Proteínas ribossomais são exemplos de biomarcadores confiáveis para a identificação bacteriana, pois desempenham funções vitais da célula e são altamente conservadas em sua sequência de aminoácidos. O classificador bacteriano Ribopeaks usa dados de massas moleculares dessas proteínas para a identificação do organismo. No entanto, espectros de bactérias inteiras podem conter picos correspondentes a proteínas não-ribossomais, peptídeos, metabólitos e lipídios em sua assinatura, o que dificulta a correta classificação. Diante disso, este trabalho utilizou da abordagem de agrupamento, por meio do algoritmo DBSCAN, do inglês Density-Based Spatial Clustering of Applications with Noise, para encontrar grupos de proteínas ribossomais sem distinção dos tipos, de modo a obter um filtro que identifique a partir da massa de uma macromolécula sua compatibilidade com uma proteína ribossomal. Para desenvolver os modelos, a base de dados Puchuy contendo as massas estimadas das proteínas ribossomais foi empregada. Essa base passou por uma fase de pré-processamento antes de ser submetida ao processo de aprendizado de máquina. Um automatizador para múltiplas classificações bacterianas no Ribopeaks foi construído para viabilizar a validação dos modelos gerados, enviando os organismos da base de dados reais SpectraBank ao classificador antes e após a filtragem dos picos. O filtro conseguiu aumentar discretamente a precisão do classificador bacteriano, ao mesmo tempo em que reduziu em média 40,1% do número de picos presentes na amostra bacteriana. Além disso, houve uma diminuição de 35,66% no tempo necessário para classificar esses mesmos organismos. |
publishDate |
2023 |
dc.date.accessioned.fl_str_mv |
2023-11-06T17:15:00Z |
dc.date.available.fl_str_mv |
2023-11-06 2023-11-06T17:15:00Z |
dc.date.issued.fl_str_mv |
2023-08-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
OYAMA, Luiz Otávio. Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023. |
dc.identifier.uri.fl_str_mv |
http://tede2.uepg.br/jspui/handle/prefix/4059 |
identifier_str_mv |
OYAMA, Luiz Otávio. Desenvolvimento de uma ferramenta para identificar proteínas ribossomais em espectro de massa do tipo MALDI-TOF. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Estadual de Ponta Grossa, Ponta Grossa, 2023. |
url |
http://tede2.uepg.br/jspui/handle/prefix/4059 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Estadual de Ponta Grossa |
dc.publisher.program.fl_str_mv |
Programa de Pós Graduação Computação Aplicada |
dc.publisher.initials.fl_str_mv |
UEPG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento de Informática |
publisher.none.fl_str_mv |
Universidade Estadual de Ponta Grossa |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UEPG instname:Universidade Estadual de Ponta Grossa (UEPG) instacron:UEPG |
instname_str |
Universidade Estadual de Ponta Grossa (UEPG) |
instacron_str |
UEPG |
institution |
UEPG |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UEPG |
collection |
Biblioteca Digital de Teses e Dissertações da UEPG |
bitstream.url.fl_str_mv |
http://tede2.uepg.br/jspui/bitstream/prefix/4059/3/license.txt http://tede2.uepg.br/jspui/bitstream/prefix/4059/2/license_rdf http://tede2.uepg.br/jspui/bitstream/prefix/4059/1/Luiz%20Ot%c3%a1vio%20Oyama%20.pdf |
bitstream.checksum.fl_str_mv |
43cd690d6a359e86c1fe3d5b7cba0c9b e39d27027a6cc9cb039ad269a5db8e34 9bfbb59d218f5c1f8b592b0e237e015c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UEPG - Universidade Estadual de Ponta Grossa (UEPG) |
repository.mail.fl_str_mv |
bicen@uepg.br||mv_fidelis@yahoo.com.br |
_version_ |
1809460482207121408 |