Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2

Detalhes bibliográficos
Autor(a) principal: Silva, Elias de Abreu Domingos
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFU
Texto Completo: https://repositorio.ufu.br/handle/123456789/36301
http://doi.org/10.14393/ufu.di.2022.571
Resumo: O design de peptídeos capazes de inibir a infecção viral tem sido considerado uma das estratégias potenciais para reduzir a transmissão do SARS-CoV-2. No entanto, a questão crítica para o design de peptídeos é o grande espaço de busca, o que torna inviável avaliar todas as possibilidades. Além disso, a maioria das análises relacionadas adota docking molecular in silico para selecionar potenciais peptídeos, que é uma técnica demorada e altamente dependente da estrutura molecular dos peptídeos já conhecidos e da proteína alvo. Com o objetivo de auxiliar na avaliação, descoberta e seleção de peptídeos para cálculo de docking, desenvolvemos o SAGAPEP, um framework de Algoritmo Genético Assistido por Surrogate capaz de encontrar peptídeos com potencial para bloquear a proteína Spike do SARS-CoV-2. O modelo surrogate é usado para avaliação rápida e de alta fidelidade da energia de interação entre um peptídeo e a proteína Spike, enquanto o algoritmo genético busca descobrir e selecionar peptídeos de alto potencial inspirados em princípios de genética e seleção natural. Os experimentos foram conduzidos usando um conjunto de dados composto por vários peptídeos potenciais obtidos por meio de docking molecular por especialistas em bioinformática. Como principais resultados, o SAGAPEP obteve baixas previsões de erro de seu componente surrogate treinado sobre esse conjunto de dados e foi capaz de descobrir e selecionar peptídeos com melhor energia de ligação do que todos listados no conjunto de dados. Além disso, os resultados notáveis do SAGAPEP sugerem que ele também pode ter o potencial de fornecer resultados promissores para outros problemas de design de peptídeos.
id UFU_ed606b67ced1e775fe55f82b737bbd8e
oai_identifier_str oai:repositorio.ufu.br:123456789/36301
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling 2022-10-20T16:38:24Z2022-10-20T16:38:24Z2022-09-29SILVA, Elias de Abreu Domingos. Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2. 2022. 79 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.571.https://repositorio.ufu.br/handle/123456789/36301http://doi.org/10.14393/ufu.di.2022.571O design de peptídeos capazes de inibir a infecção viral tem sido considerado uma das estratégias potenciais para reduzir a transmissão do SARS-CoV-2. No entanto, a questão crítica para o design de peptídeos é o grande espaço de busca, o que torna inviável avaliar todas as possibilidades. Além disso, a maioria das análises relacionadas adota docking molecular in silico para selecionar potenciais peptídeos, que é uma técnica demorada e altamente dependente da estrutura molecular dos peptídeos já conhecidos e da proteína alvo. Com o objetivo de auxiliar na avaliação, descoberta e seleção de peptídeos para cálculo de docking, desenvolvemos o SAGAPEP, um framework de Algoritmo Genético Assistido por Surrogate capaz de encontrar peptídeos com potencial para bloquear a proteína Spike do SARS-CoV-2. O modelo surrogate é usado para avaliação rápida e de alta fidelidade da energia de interação entre um peptídeo e a proteína Spike, enquanto o algoritmo genético busca descobrir e selecionar peptídeos de alto potencial inspirados em princípios de genética e seleção natural. Os experimentos foram conduzidos usando um conjunto de dados composto por vários peptídeos potenciais obtidos por meio de docking molecular por especialistas em bioinformática. Como principais resultados, o SAGAPEP obteve baixas previsões de erro de seu componente surrogate treinado sobre esse conjunto de dados e foi capaz de descobrir e selecionar peptídeos com melhor energia de ligação do que todos listados no conjunto de dados. Além disso, os resultados notáveis do SAGAPEP sugerem que ele também pode ter o potencial de fornecer resultados promissores para outros problemas de design de peptídeos.The design of peptides capable of inhibiting the SARS-CoV-2 viral infection has been considered one of the potential strategies to reduce the transmission of SARS-CoV-2. However, a critical issue in peptide design is the large search space, which makes it impracticable to evaluate all possibilities. Furthermore, most related works adopt in silico molecular docking to select potential peptides, which is a time-consuming technique and highly dependent on the molecular structure of already known peptides and the target protein. Aiming to assist the evaluation, discovery and selection of peptides for docking calculation, we developed SAGAPEP, a Surrogate-Assisted Genetic Algorithm framework capable of finding peptides with potential to block the SARS-CoV-2 Spike protein. The surrogate model is used for fast and high-fidelity evaluation of the interaction energy between a peptide and the Spike protein, while the genetic algorithm seeks to discover and select high-potential peptides inspired by principles of genetics and natural selection. Experiments were conducted using a data set composed of several potential peptides obtained through molecular docking by bio-informatics specialists. As main results, SAGAPEP achieved low error predictions from its surrogate component trained over that data set, and was able to discover and select peptides with higher binding energy than all listed in the data set. Moreover, the noteworthy results of SAGAPEP suggest it may also have the potential to provide promising results for other peptide design problems.Dissertação (Mestrado)2024-10-17porUniversidade Federal de UberlândiaPrograma de Pós-graduação em Ciência da ComputaçãoBrasilCNPQ::CIENCIAS EXATAS E DA TERRAComputaçãoCOVID-19 (Doença)Aprendizado do computadorAlgorítmos genéticosSARS-CoV-2Design de PeptídeoAprendizado de MáquinaCOVID-19Algoritmo GenéticoPeptide DesignMachine LearningSurrogate ModelsGenetic AlgorithmsAlgoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2Surrogate assisted genetic algorithm to evaluate and discover peptides against the SARS-CoV-2info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisMartins, Luiz Gustavo Almeidahttp://lattes.cnpq.br/2546751023256424Carneiro, Murillo Guimarãeshttp://lattes.cnpq.br/8158868389973535Tinós, Renatohttp://lattes.cnpq.br/1273134370963830Nicolau Junior, Nilsonhttp://lattes.cnpq.br/0821186870496558https://lattes.cnpq.br/9948063120193001Silva, Elias de Abreu Domingos79III - resultados de pesquisa cujo conteúdo seja passível de ser patenteado ou publicado em livros e capítulos;info:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFUORIGINALAlgoritmoGenéticoAssistido.pdfAlgoritmoGenéticoAssistido.pdfDissertaçãoapplication/pdf2508705https://repositorio.ufu.br/bitstream/123456789/36301/7/AlgoritmoGen%c3%a9ticoAssistido.pdfbdc65028eada08152c65bf27f898696eMD57LICENSElicense.txtlicense.txttext/plain; charset=utf-81792https://repositorio.ufu.br/bitstream/123456789/36301/6/license.txt48ded82ce41b8d2426af12aed6b3cbf3MD56TEXTAlgoritmoGenéticoAssistido.pdf.txtAlgoritmoGenéticoAssistido.pdf.txtExtracted texttext/plain128362https://repositorio.ufu.br/bitstream/123456789/36301/8/AlgoritmoGen%c3%a9ticoAssistido.pdf.txt72685d2048e50a0623bbfe38591e0cceMD58THUMBNAILAlgoritmoGenéticoAssistido.pdf.jpgAlgoritmoGenéticoAssistido.pdf.jpgGenerated Thumbnailimage/jpeg1347https://repositorio.ufu.br/bitstream/123456789/36301/9/AlgoritmoGen%c3%a9ticoAssistido.pdf.jpgd6f677004c8653bdc0b29593f1d49e40MD59123456789/363012022-10-21 03:21:18.521oai:repositorio.ufu.br:123456789/36301w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLCBhbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbm8gUmVwb3NpdMOzcmlvLiBQb3IgZmF2b3IsIGxlaWEgYSBsaWNlbsOnYSBhdGVudGFtZW50ZS4gQ2FzbyBuZWNlc3NpdGUgZGUgYWxndW0gZXNjbGFyZWNpbWVudG8gZW50cmUgZW0gY29udGF0byBhdHJhdsOpcyBkbyBlLW1haWwgIHJlcG9zaXRvcmlvQHVmdS5ici4KCkxJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBbyBhc3NpbmFyIGUgZW50cmVnYXIgZXN0YSBsaWNlbsOnYSwgby9hIFNyLi9TcmEuIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpOgoKYSkgQ29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0gZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLgoKU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBVYmVybMOibmRpYSwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFViZXJsw6JuZGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldShzKSBub21lKHMpIGNvbW8gbyhzKSBhdXRvcihlcykgb3UgZGV0ZW50b3IgKGVzKSBkb3MgZGlyZWl0b3MgZG8gZG9jdW1lbnRvIGVudHJlZ3VlLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2022-10-21T06:21:18Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.pt_BR.fl_str_mv Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
dc.title.alternative.pt_BR.fl_str_mv Surrogate assisted genetic algorithm to evaluate and discover peptides against the SARS-CoV-2
title Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
spellingShingle Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
Silva, Elias de Abreu Domingos
CNPQ::CIENCIAS EXATAS E DA TERRA
SARS-CoV-2
Design de Peptídeo
Aprendizado de Máquina
COVID-19
Algoritmo Genético
Peptide Design
Machine Learning
Surrogate Models
Genetic Algorithms
Computação
COVID-19 (Doença)
Aprendizado do computador
Algorítmos genéticos
title_short Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
title_full Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
title_fullStr Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
title_full_unstemmed Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
title_sort Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2
author Silva, Elias de Abreu Domingos
author_facet Silva, Elias de Abreu Domingos
author_role author
dc.contributor.advisor-co1.fl_str_mv Martins, Luiz Gustavo Almeida
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/2546751023256424
dc.contributor.advisor1.fl_str_mv Carneiro, Murillo Guimarães
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8158868389973535
dc.contributor.referee1.fl_str_mv Tinós, Renato
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/1273134370963830
dc.contributor.referee2.fl_str_mv Nicolau Junior, Nilson
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/0821186870496558
dc.contributor.authorLattes.fl_str_mv https://lattes.cnpq.br/9948063120193001
dc.contributor.author.fl_str_mv Silva, Elias de Abreu Domingos
contributor_str_mv Martins, Luiz Gustavo Almeida
Carneiro, Murillo Guimarães
Tinós, Renato
Nicolau Junior, Nilson
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
topic CNPQ::CIENCIAS EXATAS E DA TERRA
SARS-CoV-2
Design de Peptídeo
Aprendizado de Máquina
COVID-19
Algoritmo Genético
Peptide Design
Machine Learning
Surrogate Models
Genetic Algorithms
Computação
COVID-19 (Doença)
Aprendizado do computador
Algorítmos genéticos
dc.subject.por.fl_str_mv SARS-CoV-2
Design de Peptídeo
Aprendizado de Máquina
COVID-19
Algoritmo Genético
Peptide Design
Machine Learning
Surrogate Models
Genetic Algorithms
dc.subject.autorizado.pt_BR.fl_str_mv Computação
COVID-19 (Doença)
Aprendizado do computador
Algorítmos genéticos
description O design de peptídeos capazes de inibir a infecção viral tem sido considerado uma das estratégias potenciais para reduzir a transmissão do SARS-CoV-2. No entanto, a questão crítica para o design de peptídeos é o grande espaço de busca, o que torna inviável avaliar todas as possibilidades. Além disso, a maioria das análises relacionadas adota docking molecular in silico para selecionar potenciais peptídeos, que é uma técnica demorada e altamente dependente da estrutura molecular dos peptídeos já conhecidos e da proteína alvo. Com o objetivo de auxiliar na avaliação, descoberta e seleção de peptídeos para cálculo de docking, desenvolvemos o SAGAPEP, um framework de Algoritmo Genético Assistido por Surrogate capaz de encontrar peptídeos com potencial para bloquear a proteína Spike do SARS-CoV-2. O modelo surrogate é usado para avaliação rápida e de alta fidelidade da energia de interação entre um peptídeo e a proteína Spike, enquanto o algoritmo genético busca descobrir e selecionar peptídeos de alto potencial inspirados em princípios de genética e seleção natural. Os experimentos foram conduzidos usando um conjunto de dados composto por vários peptídeos potenciais obtidos por meio de docking molecular por especialistas em bioinformática. Como principais resultados, o SAGAPEP obteve baixas previsões de erro de seu componente surrogate treinado sobre esse conjunto de dados e foi capaz de descobrir e selecionar peptídeos com melhor energia de ligação do que todos listados no conjunto de dados. Além disso, os resultados notáveis do SAGAPEP sugerem que ele também pode ter o potencial de fornecer resultados promissores para outros problemas de design de peptídeos.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-10-20T16:38:24Z
dc.date.available.fl_str_mv 2022-10-20T16:38:24Z
dc.date.issued.fl_str_mv 2022-09-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Elias de Abreu Domingos. Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2. 2022. 79 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.571.
dc.identifier.uri.fl_str_mv https://repositorio.ufu.br/handle/123456789/36301
dc.identifier.doi.pt_BR.fl_str_mv http://doi.org/10.14393/ufu.di.2022.571
identifier_str_mv SILVA, Elias de Abreu Domingos. Algoritmo genético assistido por surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2. 2022. 79 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2022. DOI http://doi.org/10.14393/ufu.di.2022.571.
url https://repositorio.ufu.br/handle/123456789/36301
http://doi.org/10.14393/ufu.di.2022.571
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Uberlândia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
bitstream.url.fl_str_mv https://repositorio.ufu.br/bitstream/123456789/36301/7/AlgoritmoGen%c3%a9ticoAssistido.pdf
https://repositorio.ufu.br/bitstream/123456789/36301/6/license.txt
https://repositorio.ufu.br/bitstream/123456789/36301/8/AlgoritmoGen%c3%a9ticoAssistido.pdf.txt
https://repositorio.ufu.br/bitstream/123456789/36301/9/AlgoritmoGen%c3%a9ticoAssistido.pdf.jpg
bitstream.checksum.fl_str_mv bdc65028eada08152c65bf27f898696e
48ded82ce41b8d2426af12aed6b3cbf3
72685d2048e50a0623bbfe38591e0cce
d6f677004c8653bdc0b29593f1d49e40
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1802110428215508992