Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1641175 |
Resumo: | Orientadores: Zanoni Dias, Hélio Pedrini |
id |
UNICAMP-30_e51e8495714154481e085cf0e816a982 |
---|---|
oai_identifier_str |
oai::1162360 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLASTProtein secondary structure prediction using machine learning and BLASTAprendizado de máquinaAprendizado profundoProteinas - EstruturaMachine learningDeep learningProteins - StructureOrientadores: Zanoni Dias, Hélio PedriniDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Proteínas, que são sequências de aminoácidos, são fundamentais em diversos processos biológicos dos seres vivos. Devido às interações físicas e químicas entre os aminoácidos que formam as proteínas, estruturas tridimensionais locais e globais são formadas. Com os avanços tecnológicos na área biológica, o sequenciamento de proteínas se tornou simples e rápido de ser feito. Por outro lado, a definição de estruturas tridimensionais locais, chamadas de estruturas secundárias, e globais, chamadas de estruturas terciárias, continua custosa. Estruturas tridimensionais têm alto impacto na definição de funções de proteínas e no auxílio ao desenvolvimento de aplicações, como remédios e biossensores. Como opção para a definição de estruturas globais das proteínas a partir da sequência de aminoácidos, a análise de estruturas secundárias se tornou o principal método intermediário na literatura. Para realizar a predição de estruturas secundárias, duas abordagens são mais comumente utilizadas, sendo elas métodos baseados em modelo, que usam ferramentas que encontram proteínas similares, e métodos livres de modelo, que usam classificadores de aprendizado de máquina. Nos trabalhos recentes, diversas metodologias foram propostas para predizer estruturas secundárias, porém este problema continua em aberto. Outro ponto importante nos métodos atuais é que a maioria das abordagens utiliza informações evolutivas além da sequência de aminoácidos que formam as proteínas, sendo incapazes de predizer estruturas secundárias utilizando apenas a cadeia de aminoácidos. Nesta pesquisa, propomos diversos classificadores baseados em modelo e livres de modelo para realizar a classificação de estruturas secundárias das proteínas. Além da análise individual dos classificadores, investigamos a fusão entre os preditores baseados em modelo e preditores livres de modelo, assim como a fusão entre todos os classificadores. Nossos preditores são capazes de classificar estruturas secundárias a partir de sequências de aminoácidos com ou sem informações evolutivas, o que não é possível para a maioria dos métodos disponíveis na literatura. Os resultados obtidos em três bases de dados diferentes mostram que nossos classificadores são competitivos comparados com as abordagens da literatura.Abstract: Proteins, which are sequences of amino acids, are fundamental in several biological processes of living beings. Due to physical and chemical interactions between the amino acids that form proteins, local and global three-dimensional structures are formed. With technological advances in the biological area, protein sequencing has become simple and quick to be done. On the other hand, the definition of local three-dimensional structures, called secondary structures, and global three-dimensional structures, called tertiary structures, remains costly. Three-dimensional structures have a high impact on the definition of protein functions and the aid of application development, such as medicines and biosensors. As an option for the definition of global protein structures from the amino acid sequence, the analysis of secondary structures has become the main intermediate method in the literature. To perform the prediction of secondary structures, two approaches are most commonly used, namely template-based methods, which use tools that find similar proteins, and template-free methods, which use machine learning classifiers. In recent works, several methodologies have been proposed to predict secondary structures, but this problem remains open. Another important point in current methods is that most approaches use evolutionary information in addition to the sequence of amino acids that form proteins, being unable to predict secondary structures using only the chain of amino acids. In this research, we propose several template-based and template-free models to classify secondary structures of proteins. In addition to the individual classifier analysis, we investigated the fusion between template-based predictors and template-free predictors, as well as the fusion between all classifiers. Our predictors can classify secondary structures from amino acid sequences with or without evolutionary information, which is not possible for most methods available in the literature. The results obtained in three different databases show that our classifiers are competitive compared to the approaches in the literature.MestradoCiência da ComputaçãoMestre em Ciência da Computação[s.n.]Dias, Zanoni, 1975-Pedrini, Hélio, 1963-Cerri, RicardoTelles, Guilherme PimentelUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASOliveira, Gabriel Bianchin de, 1997-20212021-03-11T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online ( 139 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1641175OLIVEIRA, Gabriel Bianchin de. Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST . 2021. 1 recurso online ( 139 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641175. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1162360Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-04-29T08:39:17Zoai::1162360Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-04-29T08:39:17Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST Protein secondary structure prediction using machine learning and BLAST |
title |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST |
spellingShingle |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST Oliveira, Gabriel Bianchin de, 1997- Aprendizado de máquina Aprendizado profundo Proteinas - Estrutura Machine learning Deep learning Proteins - Structure |
title_short |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST |
title_full |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST |
title_fullStr |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST |
title_full_unstemmed |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST |
title_sort |
Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST |
author |
Oliveira, Gabriel Bianchin de, 1997- |
author_facet |
Oliveira, Gabriel Bianchin de, 1997- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dias, Zanoni, 1975- Pedrini, Hélio, 1963- Cerri, Ricardo Telles, Guilherme Pimentel Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Oliveira, Gabriel Bianchin de, 1997- |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Aprendizado profundo Proteinas - Estrutura Machine learning Deep learning Proteins - Structure |
topic |
Aprendizado de máquina Aprendizado profundo Proteinas - Estrutura Machine learning Deep learning Proteins - Structure |
description |
Orientadores: Zanoni Dias, Hélio Pedrini |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2021-03-11T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1641175 OLIVEIRA, Gabriel Bianchin de. Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST . 2021. 1 recurso online ( 139 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641175. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1641175 |
identifier_str_mv |
OLIVEIRA, Gabriel Bianchin de. Predição de estruturas secundárias de proteínas usando aprendizado de máquina e BLAST . 2021. 1 recurso online ( 139 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641175. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1162360 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online ( 139 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189172341112832 |