Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos

Detalhes bibliográficos
Autor(a) principal: Mausbach Filho, Amaury, 1964-
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/7681
Resumo: Orientador: João Meidanis
id UNICAMP-30_946b4c44ac9c73989ebcd9cc1bf72e40
oai_identifier_str oai::1260506
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítoposApplication of recurrent neural networks to the design of antibodies from the amino acid sequence of epitopesRedes neurais recorrentesEpitoposRecurrent neural networksEpitopesParatopeAntibodies - DesignParatopoOrientador: João MeidanisDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Anticorpos são elementos criados pelo sistema imunológico adaptativo dos mamíferos, apartir da identificação de um epítopo (segmento de uma parte externa de um antígeno) estranho ao corpo hospedeiro, com a finalidade de combate específico ao epítopo identificado. O desenho de anticorpos a partir de epítopos tem sido muito pesquisado no tratamentode certas doenças virais, e de alguns tipos de câncer que não respondem de maneira eficaz aos tratamentos convencionais. Nesta pesquisa, procuramos obter dados para treino eteste de preditores computacionais de anticorpos a partir de epítopos, e desenhamos uma arquitetura para avaliação. Assim, alguns bancos de dados públicos de epítopos e anticorpos foram avaliados. Foi possível verificar que a escassez de registros para treino e teste diminui a riqueza de informações. Métricas consideradas mais relevantes para análisede proteínas foram revistas e adaptadas para funcionamento em sequências com preenchimento (padding), necessárias no caso do treino por lote. Um modelo de aprendizado profundo, baseado em processamento de linguagem natural e utilizando Redes Neurais Recorrentes para a predição de CDRs(Complementarity Determining Regions), as principais partes dos anticorpos, a partir de epítopos foi implementado e avaliado. Apesar do bom desempenho nos treinos, experimentamos uma situação persistente de overfitting com baixa generalização, mesmo após a aplicação de técnicas como weight decay, data augmentation e dropout. Por fim, lançamos mão de grid search, o que permitiu uma pequena melhora dos resultados quando da aplicação de weight decayAbstract: Antibodies are elements created by the adaptive immune system of mammals, from the identification of an epitope (segment of an external part of an antigen) foreign to the human body, with the purpose of specifically combating the identified epitope. The design of antibodies from epitopes has been extensively researched in the treatment of certain viral diseases, and of some types of cancers that do not respond effectively to conventional treatments. Thus, some public databases of epitopes and antibodies were evaluated. It was possible to verify that the scarcity of records for training and testing reduces the wealth of information. Metrics considered most relevant for protein analysis were reviewed and adapted to function in padding sequences, necessary in the case of batch training. A deep learning model, based on natural language processing and using Recurrent Neural Networks to predict CDRs(Complementarity Determining Regions), the main parts of antibodies, from epitopes was implemented and evaluated. Despite the good performance in training, we experienced a persistent situation of overfitting with low generalization, even after applying techniques such as weight decay, data augmentation and dropout. Finally, we used grid search, which allowed a small improvement in results when applying weight decayMestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Meidanis, João, 1960-Pedrini, Héliode Campos-Lima, Pedro OtavioUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASMausbach Filho, Amaury, 1964-20212021-11-19T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (92 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/7681MAUSBACH FILHO, Amaury. Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos. 2021. 1 recurso online (92 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7681. Acesso em: 15 mai. 2024.https://repositorio.unicamp.br/acervo/detalhe/1260506Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-03-01T10:29:11Zoai::1260506Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2023-03-01T10:29:11Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
Application of recurrent neural networks to the design of antibodies from the amino acid sequence of epitopes
title Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
spellingShingle Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
Mausbach Filho, Amaury, 1964-
Redes neurais recorrentes
Epitopos
Recurrent neural networks
Epitopes
Paratope
Antibodies - Design
Paratopo
title_short Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
title_full Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
title_fullStr Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
title_full_unstemmed Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
title_sort Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
author Mausbach Filho, Amaury, 1964-
author_facet Mausbach Filho, Amaury, 1964-
author_role author
dc.contributor.none.fl_str_mv Meidanis, João, 1960-
Pedrini, Hélio
de Campos-Lima, Pedro Otavio
Universidade Estadual de Campinas. Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Mausbach Filho, Amaury, 1964-
dc.subject.por.fl_str_mv Redes neurais recorrentes
Epitopos
Recurrent neural networks
Epitopes
Paratope
Antibodies - Design
Paratopo
topic Redes neurais recorrentes
Epitopos
Recurrent neural networks
Epitopes
Paratope
Antibodies - Design
Paratopo
description Orientador: João Meidanis
publishDate 2021
dc.date.none.fl_str_mv 2021
2021-11-19T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/7681
MAUSBACH FILHO, Amaury. Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos. 2021. 1 recurso online (92 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7681. Acesso em: 15 mai. 2024.
url https://hdl.handle.net/20.500.12733/7681
identifier_str_mv MAUSBACH FILHO, Amaury. Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos. 2021. 1 recurso online (92 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7681. Acesso em: 15 mai. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1260506
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (92 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1799138575713828864