Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares

Detalhes bibliográficos
Autor(a) principal: Carlos Henrique da Silveira
Data de Publicação: 2008
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/GRFO-7EEQG5
Resumo: Neste trabalho foi feita uma análise comparativa entre duas metodologias clássicas no estudo de contatos em proteínas: a dependente de um delimitador de distância (CD - CutoffDependent) e outra que não é dependente de um delimitador, a decomposição de Delaunay (DT Delaunay Tessellation). Essas técnicas foram avaliadas usando-se duas formas diferentes de representação de resíduos (centróides): pelo carbono alfa (CA) e pelo centro geométrico da cadeia lateral (GC). Um banco de dados foi montado, compreendendo dois conjuntos chamados ALPHA e BETA contendo cadeias das duas principais classes do sistema de classificação CATH: all-alpha e all beta, respectivamente. Um delimitador em 7.0 Å emergiu como um importante parâmetro de distância na análise dos contatos inter-resíduos em proteínas. Este valor marca o ponto de bifurcação no comportamento das curvas decontatos entre as técnicas CD e DT. Até 7,0 Å, as propriedades CD e DT são unificadas numa mais abrangente: nesta distância, todos os contatos (arestas) são totais e verdadeiro-positivos (completos e não-oclusos). A distância de 7,0 Å é o ponto também em que a primeira camada de vizinhos encontra-se otimamente separada das demais, constituindo-se principalmente de contatos de primeira-ordem. É demonstrado que 7,0 Å é um ponto de transição entre os comportamentos lineares e quadráticos da curva do número total de vizinhos por resíduo. Também é mostrado que a técnica DT tem uma conhecida anomalia em sua contagem de arestas que, em proteínas, pode produzir omissões indesejáveis e sistemáticas afetandoprincipalmente a rede de contatos de proteínas betas com centróides em CA. Uma técnica auxiliar reconhecida por tratar essa anomalia é o quase-Delaunay (AD Almost Delaunay). É observado que mesmo AD não se mostra uma técnica proveitosa em proteínas. É empiricamente demonstrado que DT+AD convergem para CD, na medida que o parâmetro de perturbação em AD cresce. Isto alerta que DT e técnicas correlatas devem ser usadas com precaução em proteínas. Como conseqüência, no estrito intervalo de 0,0 Å a 7,0 Å, CD revela-se uma metodologia mais simples, completa e confiável. Por fim, é evidenciadotambém que a redução na representação dos resíduos aos centróides CA e GC pode introduzir tendências estatísticas na análise de vizinhos em delimitadores até 6,8 Å, com CA em favor ALPHA e GC em favor de BETA. Para valores acima de 6,8 Å, este viés parece ser eliminado. Isto provê um argumento a mais em benefício do limite em 7,0 Å, como umparâmetro de referência, robusto e de carácter geral, a ser usado de forma segura como um confiável delimitador de distância nos estudos em massa de contatos de proteínas.
id UFMG_61c1de60889564c7300825b92a7bfc1c
oai_identifier_str oai:repositorio.ufmg.br:1843/GRFO-7EEQG5
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Marcelo Matos SantoroRonaldo Alves Pinto NagemMarcos Augusto dos SantosGilney Figueira ZebendeRichard C. GarrattCarlos Henrique da Silveira2019-08-11T06:57:16Z2019-08-11T06:57:16Z2008-02-27http://hdl.handle.net/1843/GRFO-7EEQG5Neste trabalho foi feita uma análise comparativa entre duas metodologias clássicas no estudo de contatos em proteínas: a dependente de um delimitador de distância (CD - CutoffDependent) e outra que não é dependente de um delimitador, a decomposição de Delaunay (DT Delaunay Tessellation). Essas técnicas foram avaliadas usando-se duas formas diferentes de representação de resíduos (centróides): pelo carbono alfa (CA) e pelo centro geométrico da cadeia lateral (GC). Um banco de dados foi montado, compreendendo dois conjuntos chamados ALPHA e BETA contendo cadeias das duas principais classes do sistema de classificação CATH: all-alpha e all beta, respectivamente. Um delimitador em 7.0 Å emergiu como um importante parâmetro de distância na análise dos contatos inter-resíduos em proteínas. Este valor marca o ponto de bifurcação no comportamento das curvas decontatos entre as técnicas CD e DT. Até 7,0 Å, as propriedades CD e DT são unificadas numa mais abrangente: nesta distância, todos os contatos (arestas) são totais e verdadeiro-positivos (completos e não-oclusos). A distância de 7,0 Å é o ponto também em que a primeira camada de vizinhos encontra-se otimamente separada das demais, constituindo-se principalmente de contatos de primeira-ordem. É demonstrado que 7,0 Å é um ponto de transição entre os comportamentos lineares e quadráticos da curva do número total de vizinhos por resíduo. Também é mostrado que a técnica DT tem uma conhecida anomalia em sua contagem de arestas que, em proteínas, pode produzir omissões indesejáveis e sistemáticas afetandoprincipalmente a rede de contatos de proteínas betas com centróides em CA. Uma técnica auxiliar reconhecida por tratar essa anomalia é o quase-Delaunay (AD Almost Delaunay). É observado que mesmo AD não se mostra uma técnica proveitosa em proteínas. É empiricamente demonstrado que DT+AD convergem para CD, na medida que o parâmetro de perturbação em AD cresce. Isto alerta que DT e técnicas correlatas devem ser usadas com precaução em proteínas. Como conseqüência, no estrito intervalo de 0,0 Å a 7,0 Å, CD revela-se uma metodologia mais simples, completa e confiável. Por fim, é evidenciadotambém que a redução na representação dos resíduos aos centróides CA e GC pode introduzir tendências estatísticas na análise de vizinhos em delimitadores até 6,8 Å, com CA em favor ALPHA e GC em favor de BETA. Para valores acima de 6,8 Å, este viés parece ser eliminado. Isto provê um argumento a mais em benefício do limite em 7,0 Å, como umparâmetro de referência, robusto e de carácter geral, a ser usado de forma segura como um confiável delimitador de distância nos estudos em massa de contatos de proteínas.In this study we carried out a comparative analysis between two classical methodologies used to prospect residue contacts in proteins: the traditional cutoff dependent (CD) approach and the cutoff free Delaunay tessellation (DT). Additionally, two alternative coarse-grained forms to represent protein residues were tested: using alpha carbon (CA) and using side chain geometric center (GC). A database was built, comprising two top classes according to CATH classification: all alpha and all beta. We found that the cutoff value at about 7.0 Å emerges asan important distance parameter in analysis of contacts in proteins. This value was not only independent of residue representation and of protein class but it was also the point where CD and DT methods diverged regarding their results. Up to 7.0 Å, CD and DT properties areunified, which implies that at this distance all identified contacts (edges) are fully truepositives (complete and not occluded). This unification may also imply that the edges distribution up to 7.0 Å is constituted mainly by contacts involving buried sites of the first coordination shell. We also have shown that DT techniques have a known anomaly, comprehending points near the degenerate condition, which in proteins may producedangerous and systematic errors affecting mainly the contact network in beta chains with CA residue representation. The almost-Delaunay (AD) approach has been proposed to solve this DT anomaly. We found that even AD may not be an advantageous solution. We empiricallydemonstrated that the DT+A results converge to CD, as the AD threshold perturbation parameter grows. This warns that DT and correlated techniques should be used with care in contacts analysis of proteins. As a consequence, in the strict range up to 7.0 Å, the CD approach revealed to be a simpler, more complete and reliable technique than DT (or DT+AD) to prospect protein contacts. Finally, we have shown that coarse-grained residue representation may introduce bias in the analysis of neighbors in cutoffs up to 6.8 Å, with CA in favor of all alpha proteins and GC in favor of all beta proteins. Beyond 6.8 Å, this bias isapparently eliminated. This provides an additional argument in benefice of the value 7.0 Å as an important lower bound cutoff to be used in contact analysis of proteins, for both CA and GC coarse-grained models.Universidade Federal de Minas GeraisUFMGBioinformáticaProteínasProteínas globularesDistâncias inter-ResíduosVarredura exaustivaProteínas globularesContatos intracadeiaProtein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globularesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALcarlos_henrique_da_silveira_resumo.pdfapplication/pdf137111https://repositorio.ufmg.br/bitstream/1843/GRFO-7EEQG5/1/carlos_henrique_da_silveira_resumo.pdf113bf552ce49d693ef281daae5f445f2MD51TEXTcarlos_henrique_da_silveira_resumo.pdf.txtcarlos_henrique_da_silveira_resumo.pdf.txtExtracted texttext/plain15118https://repositorio.ufmg.br/bitstream/1843/GRFO-7EEQG5/2/carlos_henrique_da_silveira_resumo.pdf.txtc6ed53cb8601ecf5974e142eaf881a8dMD521843/GRFO-7EEQG52019-11-14 03:39:14.486oai:repositorio.ufmg.br:1843/GRFO-7EEQG5Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:39:14Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
title Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
spellingShingle Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
Carlos Henrique da Silveira
Distâncias inter-Resíduos
Varredura exaustiva
Proteínas globulares
Contatos intracadeia
Bioinformática
Proteínas
Proteínas globulares
title_short Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
title_full Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
title_fullStr Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
title_full_unstemmed Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
title_sort Protein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globulares
author Carlos Henrique da Silveira
author_facet Carlos Henrique da Silveira
author_role author
dc.contributor.advisor1.fl_str_mv Marcelo Matos Santoro
dc.contributor.referee1.fl_str_mv Ronaldo Alves Pinto Nagem
dc.contributor.referee2.fl_str_mv Marcos Augusto dos Santos
dc.contributor.referee3.fl_str_mv Gilney Figueira Zebende
dc.contributor.referee4.fl_str_mv Richard C. Garratt
dc.contributor.author.fl_str_mv Carlos Henrique da Silveira
contributor_str_mv Marcelo Matos Santoro
Ronaldo Alves Pinto Nagem
Marcos Augusto dos Santos
Gilney Figueira Zebende
Richard C. Garratt
dc.subject.por.fl_str_mv Distâncias inter-Resíduos
Varredura exaustiva
Proteínas globulares
Contatos intracadeia
topic Distâncias inter-Resíduos
Varredura exaustiva
Proteínas globulares
Contatos intracadeia
Bioinformática
Proteínas
Proteínas globulares
dc.subject.other.pt_BR.fl_str_mv Bioinformática
Proteínas
Proteínas globulares
description Neste trabalho foi feita uma análise comparativa entre duas metodologias clássicas no estudo de contatos em proteínas: a dependente de um delimitador de distância (CD - CutoffDependent) e outra que não é dependente de um delimitador, a decomposição de Delaunay (DT Delaunay Tessellation). Essas técnicas foram avaliadas usando-se duas formas diferentes de representação de resíduos (centróides): pelo carbono alfa (CA) e pelo centro geométrico da cadeia lateral (GC). Um banco de dados foi montado, compreendendo dois conjuntos chamados ALPHA e BETA contendo cadeias das duas principais classes do sistema de classificação CATH: all-alpha e all beta, respectivamente. Um delimitador em 7.0 Å emergiu como um importante parâmetro de distância na análise dos contatos inter-resíduos em proteínas. Este valor marca o ponto de bifurcação no comportamento das curvas decontatos entre as técnicas CD e DT. Até 7,0 Å, as propriedades CD e DT são unificadas numa mais abrangente: nesta distância, todos os contatos (arestas) são totais e verdadeiro-positivos (completos e não-oclusos). A distância de 7,0 Å é o ponto também em que a primeira camada de vizinhos encontra-se otimamente separada das demais, constituindo-se principalmente de contatos de primeira-ordem. É demonstrado que 7,0 Å é um ponto de transição entre os comportamentos lineares e quadráticos da curva do número total de vizinhos por resíduo. Também é mostrado que a técnica DT tem uma conhecida anomalia em sua contagem de arestas que, em proteínas, pode produzir omissões indesejáveis e sistemáticas afetandoprincipalmente a rede de contatos de proteínas betas com centróides em CA. Uma técnica auxiliar reconhecida por tratar essa anomalia é o quase-Delaunay (AD Almost Delaunay). É observado que mesmo AD não se mostra uma técnica proveitosa em proteínas. É empiricamente demonstrado que DT+AD convergem para CD, na medida que o parâmetro de perturbação em AD cresce. Isto alerta que DT e técnicas correlatas devem ser usadas com precaução em proteínas. Como conseqüência, no estrito intervalo de 0,0 Å a 7,0 Å, CD revela-se uma metodologia mais simples, completa e confiável. Por fim, é evidenciadotambém que a redução na representação dos resíduos aos centróides CA e GC pode introduzir tendências estatísticas na análise de vizinhos em delimitadores até 6,8 Å, com CA em favor ALPHA e GC em favor de BETA. Para valores acima de 6,8 Å, este viés parece ser eliminado. Isto provê um argumento a mais em benefício do limite em 7,0 Å, como umparâmetro de referência, robusto e de carácter geral, a ser usado de forma segura como um confiável delimitador de distância nos estudos em massa de contatos de proteínas.
publishDate 2008
dc.date.issued.fl_str_mv 2008-02-27
dc.date.accessioned.fl_str_mv 2019-08-11T06:57:16Z
dc.date.available.fl_str_mv 2019-08-11T06:57:16Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/GRFO-7EEQG5
url http://hdl.handle.net/1843/GRFO-7EEQG5
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/GRFO-7EEQG5/1/carlos_henrique_da_silveira_resumo.pdf
https://repositorio.ufmg.br/bitstream/1843/GRFO-7EEQG5/2/carlos_henrique_da_silveira_resumo.pdf.txt
bitstream.checksum.fl_str_mv 113bf552ce49d693ef281daae5f445f2
c6ed53cb8601ecf5974e142eaf881a8d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589188084301824