Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas

Detalhes bibliográficos
Autor(a) principal: Antonio Marinho da Silva Neto
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/T.76.2018.tde-07032018-150722
Resumo: Um dos maiores desafios atuais na biologia estrutural é como lidar com flexibilidade de proteínas. Além do desafio experimental, uma limitação teórica é a falta de uma linguagem matemática conveniente para representação do espaço conformacional de proteínas. As representações mais populares apresentam diversas limitações, que se refletem nas dificuldades associadas à análise de ensembles conformacionais. Nesse contexto, a aplicação de geometria diferencial (GD) e teoria da informação (TI) foi pouco explorada. Neste trabalho investigamos o uso de descritores de GD e TI como uma representação matemática do espaço conformacional de proteínas aplicada à análise de ensembles conformacionais. O cálculo dos descritores de GD consiste em representar o backbone de proteínas como curvas espaciais e caracterizá-las utilizando os seus valores de curvatura, κ, e torção, τ . Baseado nesses valores, definimos medidas de flexibilidade, de distância entre conformações e aplicamos uma estratégia de clustering para identificação de estados conformacionais. Para permitir a aplicação de TI, desenvolvemos um sistema de codificação desses descritores para expressar cada conformação por uma sequência de símbolos finitos. A partir dessas sequências, definimos uma medida da informação associada a um resíduo, Rres, e a uma conformação, Rconf. Para investigar sua eficácia, aplicamos os métodos propostos aos ensembles conformacionais de três sistemas testes: 1) Ubiquitina, 2) E1-DBD do HPV18 e 3) as etapas de formação do complexo c-Myb-KIX. A análise da representação por geometria diferencial se mostrou igualmente eficaz ou superior aos métodos comumente utilizados em todos os sistemas analisados. O método é especialmente útil para monitoramento de estabilidade de hélices e para análise de proteínas e regiões muito flexíveis, pois evita a necessidade de sobreposição estrutural. Os valores de Rconf se apresentaram úteis para análise de processos de enovelamento e resíduos próximos a regiões funcionais tendem a apresentar maiores valores Rres. No entanto, o papel desses resíduos é incerto e mais estudos são necessários para determinar se há e qual é seu real significado. Apesar disso, as medidas de informação se mostraram úteis para comparação de estados conformacionais e permitem levantar hipóteses testáveis em laboratório. Por fim, a representação por GD é computacionalmente conveniente, intuitiva, evita todas as limitações dos métodos popularmente utilizados e se mostrou eficaz para análise de ensembles conformacionais.
id USP_56fb17a5e2257d30d50633932debe801
oai_identifier_str oai:teses.usp.br:tde-07032018-150722
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas Differential geometry and information theory application to protein conformational analyses 2017-12-19Glaucius OlivaRinaldo Wander MontalvãoJorge ChahineKaline Rabelo CoutinhoLuiz Carlos Gomide FreitasJoão Renato Carvalho MunizAntonio Marinho da Silva NetoUniversidade de São PauloFísicaUSPBR Análise conformacional Conformational analyses Differential geometry Espaço conformacional Estrutura de proteínas Flexibility Geometria diferencial Information theory Protein structure Teoria da informação Um dos maiores desafios atuais na biologia estrutural é como lidar com flexibilidade de proteínas. Além do desafio experimental, uma limitação teórica é a falta de uma linguagem matemática conveniente para representação do espaço conformacional de proteínas. As representações mais populares apresentam diversas limitações, que se refletem nas dificuldades associadas à análise de ensembles conformacionais. Nesse contexto, a aplicação de geometria diferencial (GD) e teoria da informação (TI) foi pouco explorada. Neste trabalho investigamos o uso de descritores de GD e TI como uma representação matemática do espaço conformacional de proteínas aplicada à análise de ensembles conformacionais. O cálculo dos descritores de GD consiste em representar o backbone de proteínas como curvas espaciais e caracterizá-las utilizando os seus valores de curvatura, κ, e torção, τ . Baseado nesses valores, definimos medidas de flexibilidade, de distância entre conformações e aplicamos uma estratégia de clustering para identificação de estados conformacionais. Para permitir a aplicação de TI, desenvolvemos um sistema de codificação desses descritores para expressar cada conformação por uma sequência de símbolos finitos. A partir dessas sequências, definimos uma medida da informação associada a um resíduo, Rres, e a uma conformação, Rconf. Para investigar sua eficácia, aplicamos os métodos propostos aos ensembles conformacionais de três sistemas testes: 1) Ubiquitina, 2) E1-DBD do HPV18 e 3) as etapas de formação do complexo c-Myb-KIX. A análise da representação por geometria diferencial se mostrou igualmente eficaz ou superior aos métodos comumente utilizados em todos os sistemas analisados. O método é especialmente útil para monitoramento de estabilidade de hélices e para análise de proteínas e regiões muito flexíveis, pois evita a necessidade de sobreposição estrutural. Os valores de Rconf se apresentaram úteis para análise de processos de enovelamento e resíduos próximos a regiões funcionais tendem a apresentar maiores valores Rres. No entanto, o papel desses resíduos é incerto e mais estudos são necessários para determinar se há e qual é seu real significado. Apesar disso, as medidas de informação se mostraram úteis para comparação de estados conformacionais e permitem levantar hipóteses testáveis em laboratório. Por fim, a representação por GD é computacionalmente conveniente, intuitiva, evita todas as limitações dos métodos popularmente utilizados e se mostrou eficaz para análise de ensembles conformacionais. One of the major challenges of modern structural biology is how to deal with protein flexibility. Besides the experimental difficulties, a relatively overlooked theoretical challenge is the lack of a proper mathematical language to represent proteín conformational space. The most popular representations have severe limitations, which reflects on the difficulties associated with conformational ensemble analyses. However, differential geometry (GD) and information theory (TI) can help to overcome such difficulties and were not well explored in this context. Here we investigate the usage of DG and TI as a mathematical representation of protein conformational space applied to the analyses of conformational ensembles. The DG descriptors calculation consists of representing protein backbone as a spatial curve and describes it by its curvature, κ, and torsion, τ . Based on those values, the distance between conformation and flexibility measurements were defined and a clustering algorithm was applied to identify conformational states. For the application of TI, a coding system for DG descriptors was developed to express each conformation as a sequence of finite symbols. Based on those sequences, information measurements associated to a residue, Rres, and to a conformation, Rconf , were defined. To investigate its efficacy, the proposed method was applied to conformation ensembles of three test systems: 1) Ubiquitin, 2) E1-DBD of HPV18 and 3) the steps of c-Myb-KIX binding. The DG analyses show equally good or superior performance when compared with popular methods on all tested system. In addition, the methods are especially useful to monitoring helix stability and analyses of very flexible proteins (or regions), since avoids the necessity of superposing structures. The values of Rconf are useful to compare different steps of a folding process and residues near regions involved in binding events tend to present higher values of Rres. However, those residues importance is uncertain and further studies are necessary to determinate if and how those can contribute to protein function. Nevertheless, the information measurements were informative on the comparison of compare conformational states and allow to formulate a testable hypothesis. On the other hand, the GD representation is computationally convenient, intuitive and avoid most of the limitations of the popular method applied to conformational ensemble analyses. https://doi.org/10.11606/T.76.2018.tde-07032018-150722info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T18:22:50Zoai:teses.usp.br:tde-07032018-150722Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T12:16:13.573891Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
dc.title.alternative.en.fl_str_mv Differential geometry and information theory application to protein conformational analyses
title Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
spellingShingle Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
Antonio Marinho da Silva Neto
title_short Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
title_full Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
title_fullStr Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
title_full_unstemmed Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
title_sort Geometria diferencial e teoria da informação aplicada a análise de ensembles conformacionais de proteínas
author Antonio Marinho da Silva Neto
author_facet Antonio Marinho da Silva Neto
author_role author
dc.contributor.advisor1.fl_str_mv Glaucius Oliva
dc.contributor.advisor-co1.fl_str_mv Rinaldo Wander Montalvão
dc.contributor.referee1.fl_str_mv Jorge Chahine
dc.contributor.referee2.fl_str_mv Kaline Rabelo Coutinho
dc.contributor.referee3.fl_str_mv Luiz Carlos Gomide Freitas
dc.contributor.referee4.fl_str_mv João Renato Carvalho Muniz
dc.contributor.author.fl_str_mv Antonio Marinho da Silva Neto
contributor_str_mv Glaucius Oliva
Rinaldo Wander Montalvão
Jorge Chahine
Kaline Rabelo Coutinho
Luiz Carlos Gomide Freitas
João Renato Carvalho Muniz
description Um dos maiores desafios atuais na biologia estrutural é como lidar com flexibilidade de proteínas. Além do desafio experimental, uma limitação teórica é a falta de uma linguagem matemática conveniente para representação do espaço conformacional de proteínas. As representações mais populares apresentam diversas limitações, que se refletem nas dificuldades associadas à análise de ensembles conformacionais. Nesse contexto, a aplicação de geometria diferencial (GD) e teoria da informação (TI) foi pouco explorada. Neste trabalho investigamos o uso de descritores de GD e TI como uma representação matemática do espaço conformacional de proteínas aplicada à análise de ensembles conformacionais. O cálculo dos descritores de GD consiste em representar o backbone de proteínas como curvas espaciais e caracterizá-las utilizando os seus valores de curvatura, κ, e torção, τ . Baseado nesses valores, definimos medidas de flexibilidade, de distância entre conformações e aplicamos uma estratégia de clustering para identificação de estados conformacionais. Para permitir a aplicação de TI, desenvolvemos um sistema de codificação desses descritores para expressar cada conformação por uma sequência de símbolos finitos. A partir dessas sequências, definimos uma medida da informação associada a um resíduo, Rres, e a uma conformação, Rconf. Para investigar sua eficácia, aplicamos os métodos propostos aos ensembles conformacionais de três sistemas testes: 1) Ubiquitina, 2) E1-DBD do HPV18 e 3) as etapas de formação do complexo c-Myb-KIX. A análise da representação por geometria diferencial se mostrou igualmente eficaz ou superior aos métodos comumente utilizados em todos os sistemas analisados. O método é especialmente útil para monitoramento de estabilidade de hélices e para análise de proteínas e regiões muito flexíveis, pois evita a necessidade de sobreposição estrutural. Os valores de Rconf se apresentaram úteis para análise de processos de enovelamento e resíduos próximos a regiões funcionais tendem a apresentar maiores valores Rres. No entanto, o papel desses resíduos é incerto e mais estudos são necessários para determinar se há e qual é seu real significado. Apesar disso, as medidas de informação se mostraram úteis para comparação de estados conformacionais e permitem levantar hipóteses testáveis em laboratório. Por fim, a representação por GD é computacionalmente conveniente, intuitiva, evita todas as limitações dos métodos popularmente utilizados e se mostrou eficaz para análise de ensembles conformacionais.
publishDate 2017
dc.date.issued.fl_str_mv 2017-12-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/T.76.2018.tde-07032018-150722
url https://doi.org/10.11606/T.76.2018.tde-07032018-150722
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Física
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794502350659911680