Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/7681 |
Resumo: | Orientador: João Meidanis |
id |
UNICAMP-30_946b4c44ac9c73989ebcd9cc1bf72e40 |
---|---|
oai_identifier_str |
oai::1260506 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítoposApplication of recurrent neural networks to the design of antibodies from the amino acid sequence of epitopesRedes neurais recorrentesEpitoposRecurrent neural networksEpitopesParatopeAntibodies - DesignParatopoOrientador: João MeidanisDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Anticorpos são elementos criados pelo sistema imunológico adaptativo dos mamíferos, apartir da identificação de um epítopo (segmento de uma parte externa de um antígeno) estranho ao corpo hospedeiro, com a finalidade de combate específico ao epítopo identificado. O desenho de anticorpos a partir de epítopos tem sido muito pesquisado no tratamentode certas doenças virais, e de alguns tipos de câncer que não respondem de maneira eficaz aos tratamentos convencionais. Nesta pesquisa, procuramos obter dados para treino eteste de preditores computacionais de anticorpos a partir de epítopos, e desenhamos uma arquitetura para avaliação. Assim, alguns bancos de dados públicos de epítopos e anticorpos foram avaliados. Foi possível verificar que a escassez de registros para treino e teste diminui a riqueza de informações. Métricas consideradas mais relevantes para análisede proteínas foram revistas e adaptadas para funcionamento em sequências com preenchimento (padding), necessárias no caso do treino por lote. Um modelo de aprendizado profundo, baseado em processamento de linguagem natural e utilizando Redes Neurais Recorrentes para a predição de CDRs(Complementarity Determining Regions), as principais partes dos anticorpos, a partir de epítopos foi implementado e avaliado. Apesar do bom desempenho nos treinos, experimentamos uma situação persistente de overfitting com baixa generalização, mesmo após a aplicação de técnicas como weight decay, data augmentation e dropout. Por fim, lançamos mão de grid search, o que permitiu uma pequena melhora dos resultados quando da aplicação de weight decayAbstract: Antibodies are elements created by the adaptive immune system of mammals, from the identification of an epitope (segment of an external part of an antigen) foreign to the human body, with the purpose of specifically combating the identified epitope. The design of antibodies from epitopes has been extensively researched in the treatment of certain viral diseases, and of some types of cancers that do not respond effectively to conventional treatments. Thus, some public databases of epitopes and antibodies were evaluated. It was possible to verify that the scarcity of records for training and testing reduces the wealth of information. Metrics considered most relevant for protein analysis were reviewed and adapted to function in padding sequences, necessary in the case of batch training. A deep learning model, based on natural language processing and using Recurrent Neural Networks to predict CDRs(Complementarity Determining Regions), the main parts of antibodies, from epitopes was implemented and evaluated. Despite the good performance in training, we experienced a persistent situation of overfitting with low generalization, even after applying techniques such as weight decay, data augmentation and dropout. Finally, we used grid search, which allowed a small improvement in results when applying weight decayMestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Meidanis, João, 1960-Pedrini, Héliode Campos-Lima, Pedro OtavioUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASMausbach Filho, Amaury, 1964-20212021-11-19T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (92 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/7681MAUSBACH FILHO, Amaury. Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos. 2021. 1 recurso online (92 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7681. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1260506Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2023-03-01T10:29:11Zoai::1260506Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2023-03-01T10:29:11Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos Application of recurrent neural networks to the design of antibodies from the amino acid sequence of epitopes |
title |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos |
spellingShingle |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos Mausbach Filho, Amaury, 1964- Redes neurais recorrentes Epitopos Recurrent neural networks Epitopes Paratope Antibodies - Design Paratopo |
title_short |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos |
title_full |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos |
title_fullStr |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos |
title_full_unstemmed |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos |
title_sort |
Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos |
author |
Mausbach Filho, Amaury, 1964- |
author_facet |
Mausbach Filho, Amaury, 1964- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Meidanis, João, 1960- Pedrini, Hélio de Campos-Lima, Pedro Otavio Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Mausbach Filho, Amaury, 1964- |
dc.subject.por.fl_str_mv |
Redes neurais recorrentes Epitopos Recurrent neural networks Epitopes Paratope Antibodies - Design Paratopo |
topic |
Redes neurais recorrentes Epitopos Recurrent neural networks Epitopes Paratope Antibodies - Design Paratopo |
description |
Orientador: João Meidanis |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2021-11-19T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/7681 MAUSBACH FILHO, Amaury. Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos. 2021. 1 recurso online (92 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7681. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/7681 |
identifier_str_mv |
MAUSBACH FILHO, Amaury. Aplicação de redes neurais recorrentes ao projeto de anticorpos a partir da sequência de aminoácidos de epítopos. 2021. 1 recurso online (92 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/7681. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1260506 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (92 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189187283320832 |