Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis

Honorato, Rodrigo Vargas

Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis

Detalhes bibliográficos
Autor(a) principal:	Honorato, Rodrigo Vargas
Data de Publicação:	2015
Tipo de documento:	Tese
Idioma:	por
Título da fonte:	Biblioteca Digital de Teses e Dissertações da USP
Texto Completo:	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04012016-152835/
Resumo:	Domínio proteico é uma sequência de aminoácidos evolutivamente conservada e funcionalmente independente. Um dos aspectos mais importantes do estudo de uma proteína que contem múltiplos domínios é o entendimento da comunicação, entre os diferentes domínios, e seu papel biológico. Essa comunicação em maior parte é feita pela interação direta entre domínios. A interação poderia ser tratada como uma clássica interação proteína-proteína. Entretanto, proteínas multidomínio possuem restrições determinadas por suas regiões conectoras. Os conectores interdomínio impõem restrições e limitam espaço conformacional dos domínios. Apresentamos aqui o MAD, uma rotina capaz de obter modelos tridimensionais de alta resolução para proteínas, contendo qualquer número de domínios, a partir de sua sequencia primária. Os domínios conservados são identificados utilizando a base de domínios conservados (CDD) e seus limites são utilizados para definir as regiões conectoras. É criado um ensamble de possíveis dobramentos dos conectores e sua distribuição de distâncias C/N-terminais são utilizadas como restrição espacial na busca pela interação entre os domínios.Os modelos dos domínios são obtidos por uma modelagem comparativa. Foi implementada uma heurística, capaz de lidar com a natureza combinatorial dos múltiplos domínios e com a necessidade imposta pela limitação computacional de realizar o docking dos domínios em forma de pares. Todas combinações de domínios são submetidas as rotinas de docking. Aplica-se filtro de distância e energético, excluindo as conformações que apresentam distância C/N-terminal entre domínios maior do que o valor máximo observado no ensamble de conectores e seleciona as conformações energeticamente mais favoráveis. As conformações são submetidas a uma rotina de agrupamento hierárquico baseada em sua similaridade estrutural. Para a segunda fase as conformações selecionadas são pareadas com seu domínio complementar e ressubmetidas a rotina de docking até que todas as fases tenham sido completadas. Foi criado um conjunto de testes a partir do Protein Data Bank contendo 54 proteínas multidomínio para que a rotina de docking do MAD fosse comparada com outros softwares utilizados pela comunidade cientifica, mostrou-se superior ou equivalente aos métodos testados. A capacidade de utilizar dados experimentais foi demostrada através da proposição de um modelo da forma ativa da enzima tirosina fosfatase 2, nunca observado experimentalmente. A rotina de docking foi expandida paralelamente em uma aplicação standalone e utilizada na resolução de diversos problemas biológicos. Concluímos que a inovação metodológica proposta pelo MAD é de grande valia para a modelagem molecular e tem potencial de gerar uma nova perspectiva a respeito da interação de proteína multidomínio, visto que é possível analisar essas proteínas em sua plenitude e não como domínios separados.

Metadados do item

id	USP_2eecc288287466b6bc5639d8c1b5f974
oai_identifier_str	oai:teses.usp.br:tde-04012016-152835
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis Implementation of a hybrid approach using comparative and ab initio modelling to predict the three dimensional structure of proteins containing multiple domains and flexible connectorsInteração proteína-proteínaModelagem molecularMolecular modellingMultidomain proteinsProtein-protein interactionProteínas multidomínioDomínio proteico é uma sequência de aminoácidos evolutivamente conservada e funcionalmente independente. Um dos aspectos mais importantes do estudo de uma proteína que contem múltiplos domínios é o entendimento da comunicação, entre os diferentes domínios, e seu papel biológico. Essa comunicação em maior parte é feita pela interação direta entre domínios. A interação poderia ser tratada como uma clássica interação proteína-proteína. Entretanto, proteínas multidomínio possuem restrições determinadas por suas regiões conectoras. Os conectores interdomínio impõem restrições e limitam espaço conformacional dos domínios. Apresentamos aqui o MAD, uma rotina capaz de obter modelos tridimensionais de alta resolução para proteínas, contendo qualquer número de domínios, a partir de sua sequencia primária. Os domínios conservados são identificados utilizando a base de domínios conservados (CDD) e seus limites são utilizados para definir as regiões conectoras. É criado um ensamble de possíveis dobramentos dos conectores e sua distribuição de distâncias C/N-terminais são utilizadas como restrição espacial na busca pela interação entre os domínios.Os modelos dos domínios são obtidos por uma modelagem comparativa. Foi implementada uma heurística, capaz de lidar com a natureza combinatorial dos múltiplos domínios e com a necessidade imposta pela limitação computacional de realizar o docking dos domínios em forma de pares. Todas combinações de domínios são submetidas as rotinas de docking. Aplica-se filtro de distância e energético, excluindo as conformações que apresentam distância C/N-terminal entre domínios maior do que o valor máximo observado no ensamble de conectores e seleciona as conformações energeticamente mais favoráveis. As conformações são submetidas a uma rotina de agrupamento hierárquico baseada em sua similaridade estrutural. Para a segunda fase as conformações selecionadas são pareadas com seu domínio complementar e ressubmetidas a rotina de docking até que todas as fases tenham sido completadas. Foi criado um conjunto de testes a partir do Protein Data Bank contendo 54 proteínas multidomínio para que a rotina de docking do MAD fosse comparada com outros softwares utilizados pela comunidade cientifica, mostrou-se superior ou equivalente aos métodos testados. A capacidade de utilizar dados experimentais foi demostrada através da proposição de um modelo da forma ativa da enzima tirosina fosfatase 2, nunca observado experimentalmente. A rotina de docking foi expandida paralelamente em uma aplicação standalone e utilizada na resolução de diversos problemas biológicos. Concluímos que a inovação metodológica proposta pelo MAD é de grande valia para a modelagem molecular e tem potencial de gerar uma nova perspectiva a respeito da interação de proteína multidomínio, visto que é possível analisar essas proteínas em sua plenitude e não como domínios separados.Protein domain is an evolutionary conserved and functionally independent amino acid sequence. One of the most important aspects of the study of a protein that contains multiple domains is the understanding of communication between the different areas, and their biological role. This communication is made mostly by direct interaction between domains. The interaction could be treated as a classical protein-protein interaction. However, multidomain proteins have certain restrictions for its connector regions. The intra connectors impose restrictions and limit conformational space of the domains. We present the MAD, a routine able to get three-dimensional models of high-resolution protein, containing any number of domains, from its primary sequence. The conserved domains are identified using the basic conserved domains database (CDD) and its boundaries are used to define the connector regions. This creates a ensemble of possible folding of the connectors and distribution of distances C/N-terminals are used as spatial restriction in the search for interaction between domains.Os models of the domains are obtained by comparative modelling. A heuristic able to handle the combinatorial nature of the multiple areas and the need imposed by the computer to perform the limitation of the docking areas as pairs was implemented. All combinations of domains are referred to the docking routines. Distance and energy filters are applied, excluding conformations that have C/N-terminal domains distances larger than the maximum value observed in the connectors ensemble and selects the most favourable energy conformations. Conformations are subjected to hierarchical clustering routine based on their structural similarity. For the second phase, the selected conformations are paired with its complementary domain and resubmitted to the docking routine until all phases have been completed. A test set has been created from the Protein Data Bank containing 54 multidomain proteins so that the docking routine of MAD could be compared with other software used by the scientific community, it has been shown to be superior or equivalent to the tested methods. The ability to use experimental data was demonstrated by proposing a model of the active form of tyrosine phosphatase enzyme 2, never observed experimentally. The docking routine was expanded in a standalone application and used in solving various biological problems. We conclude that the methodological innovation proposed by the MAD is very useful for molecular modelling and has the potential to generate a new perspective on multidomain protein interaction as you can analyse these proteins in its entirety and not as separate domains.Biblioteca Digitais de Teses e Dissertações da USPOliveira, Paulo Sérgio Lopes deHonorato, Rodrigo Vargas2015-11-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-04012016-152835/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2017-09-04T21:06:17Zoai:teses.usp.br:tde-04012016-152835Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212017-09-04T21:06:17Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis Implementation of a hybrid approach using comparative and ab initio modelling to predict the three dimensional structure of proteins containing multiple domains and flexible connectors
title	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis
spellingShingle	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis Honorato, Rodrigo Vargas Interação proteína-proteína Modelagem molecular Molecular modelling Multidomain proteins Protein-protein interaction Proteínas multidomínio
title_short	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis
title_full	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis
title_fullStr	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis
title_full_unstemmed	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis
title_sort	Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis
author	Honorato, Rodrigo Vargas
author_facet	Honorato, Rodrigo Vargas
author_role	author
dc.contributor.none.fl_str_mv	Oliveira, Paulo Sérgio Lopes de
dc.contributor.author.fl_str_mv	Honorato, Rodrigo Vargas
dc.subject.por.fl_str_mv	Interação proteína-proteína Modelagem molecular Molecular modelling Multidomain proteins Protein-protein interaction Proteínas multidomínio
topic	Interação proteína-proteína Modelagem molecular Molecular modelling Multidomain proteins Protein-protein interaction Proteínas multidomínio
description	Domínio proteico é uma sequência de aminoácidos evolutivamente conservada e funcionalmente independente. Um dos aspectos mais importantes do estudo de uma proteína que contem múltiplos domínios é o entendimento da comunicação, entre os diferentes domínios, e seu papel biológico. Essa comunicação em maior parte é feita pela interação direta entre domínios. A interação poderia ser tratada como uma clássica interação proteína-proteína. Entretanto, proteínas multidomínio possuem restrições determinadas por suas regiões conectoras. Os conectores interdomínio impõem restrições e limitam espaço conformacional dos domínios. Apresentamos aqui o MAD, uma rotina capaz de obter modelos tridimensionais de alta resolução para proteínas, contendo qualquer número de domínios, a partir de sua sequencia primária. Os domínios conservados são identificados utilizando a base de domínios conservados (CDD) e seus limites são utilizados para definir as regiões conectoras. É criado um ensamble de possíveis dobramentos dos conectores e sua distribuição de distâncias C/N-terminais são utilizadas como restrição espacial na busca pela interação entre os domínios.Os modelos dos domínios são obtidos por uma modelagem comparativa. Foi implementada uma heurística, capaz de lidar com a natureza combinatorial dos múltiplos domínios e com a necessidade imposta pela limitação computacional de realizar o docking dos domínios em forma de pares. Todas combinações de domínios são submetidas as rotinas de docking. Aplica-se filtro de distância e energético, excluindo as conformações que apresentam distância C/N-terminal entre domínios maior do que o valor máximo observado no ensamble de conectores e seleciona as conformações energeticamente mais favoráveis. As conformações são submetidas a uma rotina de agrupamento hierárquico baseada em sua similaridade estrutural. Para a segunda fase as conformações selecionadas são pareadas com seu domínio complementar e ressubmetidas a rotina de docking até que todas as fases tenham sido completadas. Foi criado um conjunto de testes a partir do Protein Data Bank contendo 54 proteínas multidomínio para que a rotina de docking do MAD fosse comparada com outros softwares utilizados pela comunidade cientifica, mostrou-se superior ou equivalente aos métodos testados. A capacidade de utilizar dados experimentais foi demostrada através da proposição de um modelo da forma ativa da enzima tirosina fosfatase 2, nunca observado experimentalmente. A rotina de docking foi expandida paralelamente em uma aplicação standalone e utilizada na resolução de diversos problemas biológicos. Concluímos que a inovação metodológica proposta pelo MAD é de grande valia para a modelagem molecular e tem potencial de gerar uma nova perspectiva a respeito da interação de proteína multidomínio, visto que é possível analisar essas proteínas em sua plenitude e não como domínios separados.
publishDate	2015
dc.date.none.fl_str_mv	2015-11-17
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04012016-152835/
url	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-04012016-152835/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1815256708844355584

Implementação de uma abordagem híbrida utilizando modelagem comparativa e ab initio para predição de estruturas tridimensionais de proteínas contendo múltiplos domínios com conectores flexíveis

Registros relacionados