spelling |
Marcelo Matos SantoroRonaldo Alves Pinto NagemMarcos Augusto dos SantosGilney Figueira ZebendeRichard C. GarrattCarlos Henrique da Silveira2019-08-11T06:57:16Z2019-08-11T06:57:16Z2008-02-27http://hdl.handle.net/1843/GRFO-7EEQG5Neste trabalho foi feita uma análise comparativa entre duas metodologias clássicas no estudo de contatos em proteínas: a dependente de um delimitador de distância (CD - CutoffDependent) e outra que não é dependente de um delimitador, a decomposição de Delaunay (DT Delaunay Tessellation). Essas técnicas foram avaliadas usando-se duas formas diferentes de representação de resíduos (centróides): pelo carbono alfa (CA) e pelo centro geométrico da cadeia lateral (GC). Um banco de dados foi montado, compreendendo dois conjuntos chamados ALPHA e BETA contendo cadeias das duas principais classes do sistema de classificação CATH: all-alpha e all beta, respectivamente. Um delimitador em 7.0 Å emergiu como um importante parâmetro de distância na análise dos contatos inter-resíduos em proteínas. Este valor marca o ponto de bifurcação no comportamento das curvas decontatos entre as técnicas CD e DT. Até 7,0 Å, as propriedades CD e DT são unificadas numa mais abrangente: nesta distância, todos os contatos (arestas) são totais e verdadeiro-positivos (completos e não-oclusos). A distância de 7,0 Å é o ponto também em que a primeira camada de vizinhos encontra-se otimamente separada das demais, constituindo-se principalmente de contatos de primeira-ordem. É demonstrado que 7,0 Å é um ponto de transição entre os comportamentos lineares e quadráticos da curva do número total de vizinhos por resíduo. Também é mostrado que a técnica DT tem uma conhecida anomalia em sua contagem de arestas que, em proteínas, pode produzir omissões indesejáveis e sistemáticas afetandoprincipalmente a rede de contatos de proteínas betas com centróides em CA. Uma técnica auxiliar reconhecida por tratar essa anomalia é o quase-Delaunay (AD Almost Delaunay). É observado que mesmo AD não se mostra uma técnica proveitosa em proteínas. É empiricamente demonstrado que DT+AD convergem para CD, na medida que o parâmetro de perturbação em AD cresce. Isto alerta que DT e técnicas correlatas devem ser usadas com precaução em proteínas. Como conseqüência, no estrito intervalo de 0,0 Å a 7,0 Å, CD revela-se uma metodologia mais simples, completa e confiável. Por fim, é evidenciadotambém que a redução na representação dos resíduos aos centróides CA e GC pode introduzir tendências estatísticas na análise de vizinhos em delimitadores até 6,8 Å, com CA em favor ALPHA e GC em favor de BETA. Para valores acima de 6,8 Å, este viés parece ser eliminado. Isto provê um argumento a mais em benefício do limite em 7,0 Å, como umparâmetro de referência, robusto e de carácter geral, a ser usado de forma segura como um confiável delimitador de distância nos estudos em massa de contatos de proteínas.In this study we carried out a comparative analysis between two classical methodologies used to prospect residue contacts in proteins: the traditional cutoff dependent (CD) approach and the cutoff free Delaunay tessellation (DT). Additionally, two alternative coarse-grained forms to represent protein residues were tested: using alpha carbon (CA) and using side chain geometric center (GC). A database was built, comprising two top classes according to CATH classification: all alpha and all beta. We found that the cutoff value at about 7.0 Å emerges asan important distance parameter in analysis of contacts in proteins. This value was not only independent of residue representation and of protein class but it was also the point where CD and DT methods diverged regarding their results. Up to 7.0 Å, CD and DT properties areunified, which implies that at this distance all identified contacts (edges) are fully truepositives (complete and not occluded). This unification may also imply that the edges distribution up to 7.0 Å is constituted mainly by contacts involving buried sites of the first coordination shell. We also have shown that DT techniques have a known anomaly, comprehending points near the degenerate condition, which in proteins may producedangerous and systematic errors affecting mainly the contact network in beta chains with CA residue representation. The almost-Delaunay (AD) approach has been proposed to solve this DT anomaly. We found that even AD may not be an advantageous solution. We empiricallydemonstrated that the DT+A results converge to CD, as the AD threshold perturbation parameter grows. This warns that DT and correlated techniques should be used with care in contacts analysis of proteins. As a consequence, in the strict range up to 7.0 Å, the CD approach revealed to be a simpler, more complete and reliable technique than DT (or DT+AD) to prospect protein contacts. Finally, we have shown that coarse-grained residue representation may introduce bias in the analysis of neighbors in cutoffs up to 6.8 Å, with CA in favor of all alpha proteins and GC in favor of all beta proteins. Beyond 6.8 Å, this bias isapparently eliminated. This provides an additional argument in benefice of the value 7.0 Å as an important lower bound cutoff to be used in contact analysis of proteins, for both CA and GC coarse-grained models.Universidade Federal de Minas GeraisUFMGBioinformáticaProteínasProteínas globularesDistâncias inter-ResíduosVarredura exaustivaProteínas globularesContatos intracadeiaProtein cutoff scanning: aplicação da varredura exaustiva de distâncias inter-resíduos na análise de contatos intracadeia em proteínas globularesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALcarlos_henrique_da_silveira_resumo.pdfapplication/pdf137111https://repositorio.ufmg.br/bitstream/1843/GRFO-7EEQG5/1/carlos_henrique_da_silveira_resumo.pdf113bf552ce49d693ef281daae5f445f2MD51TEXTcarlos_henrique_da_silveira_resumo.pdf.txtcarlos_henrique_da_silveira_resumo.pdf.txtExtracted texttext/plain15118https://repositorio.ufmg.br/bitstream/1843/GRFO-7EEQG5/2/carlos_henrique_da_silveira_resumo.pdf.txtc6ed53cb8601ecf5974e142eaf881a8dMD521843/GRFO-7EEQG52019-11-14 03:39:14.486oai:repositorio.ufmg.br:1843/GRFO-7EEQG5Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T06:39:14Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
|