Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/9136 |
Resumo: | Kinases are the most intensively studied protein in drug design and development. Among kinases, non-specific serine/threonine protein kinase represents an interesting protein system for modeling purposes due to the availability of structural and functional experimental data. Non-specific serine/threonine protein kinase comprises an important class of protein targets used to develop drugs to treat cancer. In this study, we describe the creation of machine learning models to predict protein-ligand binding affinity for this enzymatic class. We make use of energy terms available in classical scoring functions such as Autodock4 and AutoDock Vina. We use these terms to build a novel scoring function targeted to a dataset comprised of nearly 100 protein-ligand complexes for which experimental crystallographic structure and inhibition constant data are available. We also applied a hybrid mass-spring method to determine binding affinity using the program Taba. We carried out predictive performance analysis of all scoring functions. Our study clearly shows that machine learning models present superior predictive performance when compared with classical scoring functions. Also, our machine learning models can capture structural features responsible for the binding affinity against non-specific serine/threonine protein kinases. |
id |
P_RS_6bc8b24b087ac34b18eaaba09e2491d6 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/9136 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Azevedo Junior, Walter Filgueira dehttp://lattes.cnpq.br/4183276948524704http://lattes.cnpq.br/8173378726733122Waszak, Rosana da Silva2020-07-02T20:06:48Z2020-03-06http://tede2.pucrs.br/tede2/handle/tede/9136Kinases are the most intensively studied protein in drug design and development. Among kinases, non-specific serine/threonine protein kinase represents an interesting protein system for modeling purposes due to the availability of structural and functional experimental data. Non-specific serine/threonine protein kinase comprises an important class of protein targets used to develop drugs to treat cancer. In this study, we describe the creation of machine learning models to predict protein-ligand binding affinity for this enzymatic class. We make use of energy terms available in classical scoring functions such as Autodock4 and AutoDock Vina. We use these terms to build a novel scoring function targeted to a dataset comprised of nearly 100 protein-ligand complexes for which experimental crystallographic structure and inhibition constant data are available. We also applied a hybrid mass-spring method to determine binding affinity using the program Taba. We carried out predictive performance analysis of all scoring functions. Our study clearly shows that machine learning models present superior predictive performance when compared with classical scoring functions. Also, our machine learning models can capture structural features responsible for the binding affinity against non-specific serine/threonine protein kinases.Cinases são as proteínas mais intensamente estudadas no desenvolvimento e desenho de fármacos. Dentre as cinases, as serino/treonino cinases não específicas representam um sistema proteico interessante para propósitos de modelagem, devido à grande disponibilidade de dados experimentais estruturais e funcionais. As serino/treonino cinases não específicas compreendem uma importante classe de proteínas alvo usadas para o desenvolvimento de fármacos para tratamento de câncer. Neste estudo, foi descrita a criação de modelos de Aprendizado de Máquina para predição de afinidade entre proteínas e ligantes para esta classe enzimática. Foram utilizados para tal termos de energia calculados por Funções Escore clássicas disponíveis em programas como AutoDock4 e AutoDock Vina. Estes termos foram empregados para a criação de novas Funções Escore específicas para um conjunto de dados composto por aproximadamente 100 complexos proteína-ligante, para os quais dados experimentais como a estrutura cristalográfica e a constante de inibição estavam disponíveis. Foi aplicado também um método híbrido que utiliza a simulação de um sistema de massa-mola para determinar a afinidade de ligação, usando o programa Taba. Todas as Funções Escore geradas tiveram sua performance preditiva analisada. Os resultados mostram claramente que os modelos de aprendizado de máquina apresentam capacidade preditiva superior quando comparados com as Funções Escore clássicas. Além disso, os modelos de Aprendizado de Máquina gerados foram capazes de identificar características estruturais, responsáveis pela afinidade de ligação junto a serino/treonino cinases não específicas.Submitted by PPG Biologia Celular e Molecular (bcm@pucrs.br) on 2020-06-02T15:57:12Z No. of bitstreams: 1 ROSANA_DA_SILVA_WASZAK_DIS.pdf: 3434876 bytes, checksum: 9c0f3861cf1acf65edd4caad9bde101b (MD5)Approved for entry into archive by Lucas Martins Kern (lucas.kern@pucrs.br) on 2020-07-02T19:40:15Z (GMT) No. of bitstreams: 1 ROSANA_DA_SILVA_WASZAK_DIS.pdf: 3434876 bytes, checksum: 9c0f3861cf1acf65edd4caad9bde101b (MD5)Made available in DSpace on 2020-07-02T20:06:48Z (GMT). No. of bitstreams: 1 ROSANA_DA_SILVA_WASZAK_DIS.pdf: 3434876 bytes, checksum: 9c0f3861cf1acf65edd4caad9bde101b (MD5) Previous issue date: 2020-03-06Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/178174/ROSANA_DA_SILVA_WASZAK_DIS.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Biologia Celular e MolecularPUCRSBrasilEscola de CiênciasFunções escoreInterações proteína-liganteAprendizado de máquinaBioinformáticaScoring functionsProtein-ligand InteractionsMachine learningBioinformaticsCIENCIAS BIOLOGICAS::BIOLOGIA GERALDesenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação3463594373552466096500500600-16345593859312446973590462550136975366info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILROSANA_DA_SILVA_WASZAK_DIS.pdf.jpgROSANA_DA_SILVA_WASZAK_DIS.pdf.jpgimage/jpeg5970http://tede2.pucrs.br/tede2/bitstream/tede/9136/4/ROSANA_DA_SILVA_WASZAK_DIS.pdf.jpgd1117db2a5260f15d0b03af73e5fef5dMD54TEXTROSANA_DA_SILVA_WASZAK_DIS.pdf.txtROSANA_DA_SILVA_WASZAK_DIS.pdf.txttext/plain111123http://tede2.pucrs.br/tede2/bitstream/tede/9136/3/ROSANA_DA_SILVA_WASZAK_DIS.pdf.txtc95a387b8bb8f67a26cef7a601532055MD53ORIGINALROSANA_DA_SILVA_WASZAK_DIS.pdfROSANA_DA_SILVA_WASZAK_DIS.pdfapplication/pdf3434876http://tede2.pucrs.br/tede2/bitstream/tede/9136/2/ROSANA_DA_SILVA_WASZAK_DIS.pdf9c0f3861cf1acf65edd4caad9bde101bMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590http://tede2.pucrs.br/tede2/bitstream/tede/9136/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/91362020-07-02 20:01:26.116oai:tede2.pucrs.br:tede/9136QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2020-07-02T23:01:26Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes |
title |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes |
spellingShingle |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes Waszak, Rosana da Silva Funções escore Interações proteína-ligante Aprendizado de máquina Bioinformática Scoring functions Protein-ligand Interactions Machine learning Bioinformatics CIENCIAS BIOLOGICAS::BIOLOGIA GERAL |
title_short |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes |
title_full |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes |
title_fullStr |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes |
title_full_unstemmed |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes |
title_sort |
Desenvolvimento e aplicação de funções escore otimizadas para previsão de afinidade entre proteínas e ligantes |
author |
Waszak, Rosana da Silva |
author_facet |
Waszak, Rosana da Silva |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Azevedo Junior, Walter Filgueira de |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4183276948524704 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/8173378726733122 |
dc.contributor.author.fl_str_mv |
Waszak, Rosana da Silva |
contributor_str_mv |
Azevedo Junior, Walter Filgueira de |
dc.subject.por.fl_str_mv |
Funções escore Interações proteína-ligante Aprendizado de máquina Bioinformática |
topic |
Funções escore Interações proteína-ligante Aprendizado de máquina Bioinformática Scoring functions Protein-ligand Interactions Machine learning Bioinformatics CIENCIAS BIOLOGICAS::BIOLOGIA GERAL |
dc.subject.eng.fl_str_mv |
Scoring functions Protein-ligand Interactions Machine learning Bioinformatics |
dc.subject.cnpq.fl_str_mv |
CIENCIAS BIOLOGICAS::BIOLOGIA GERAL |
description |
Kinases are the most intensively studied protein in drug design and development. Among kinases, non-specific serine/threonine protein kinase represents an interesting protein system for modeling purposes due to the availability of structural and functional experimental data. Non-specific serine/threonine protein kinase comprises an important class of protein targets used to develop drugs to treat cancer. In this study, we describe the creation of machine learning models to predict protein-ligand binding affinity for this enzymatic class. We make use of energy terms available in classical scoring functions such as Autodock4 and AutoDock Vina. We use these terms to build a novel scoring function targeted to a dataset comprised of nearly 100 protein-ligand complexes for which experimental crystallographic structure and inhibition constant data are available. We also applied a hybrid mass-spring method to determine binding affinity using the program Taba. We carried out predictive performance analysis of all scoring functions. Our study clearly shows that machine learning models present superior predictive performance when compared with classical scoring functions. Also, our machine learning models can capture structural features responsible for the binding affinity against non-specific serine/threonine protein kinases. |
publishDate |
2020 |
dc.date.accessioned.fl_str_mv |
2020-07-02T20:06:48Z |
dc.date.issued.fl_str_mv |
2020-03-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/9136 |
url |
http://tede2.pucrs.br/tede2/handle/tede/9136 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
3463594373552466096 |
dc.relation.confidence.fl_str_mv |
500 500 600 |
dc.relation.cnpq.fl_str_mv |
-1634559385931244697 |
dc.relation.sponsorship.fl_str_mv |
3590462550136975366 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Biologia Celular e Molecular |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola de Ciências |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/9136/4/ROSANA_DA_SILVA_WASZAK_DIS.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/9136/3/ROSANA_DA_SILVA_WASZAK_DIS.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/9136/2/ROSANA_DA_SILVA_WASZAK_DIS.pdf http://tede2.pucrs.br/tede2/bitstream/tede/9136/1/license.txt |
bitstream.checksum.fl_str_mv |
d1117db2a5260f15d0b03af73e5fef5d c95a387b8bb8f67a26cef7a601532055 9c0f3861cf1acf65edd4caad9bde101b 220e11f2d3ba5354f917c7035aadef24 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765345372733440 |