Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais

Detalhes bibliográficos
Autor(a) principal: Edson Luiz Folador
Data de Publicação: 2015
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/BUBD-A2GJPC
Resumo: Corynebacterium pseudotuberculosis (cp) belongs to the group CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), is a gram-positive facultative intracellular pathogenic bacterium, have fimbriae, is non-motile, do not form capsules and not sporulate, is presented in serovar ovis and equi. The serovar equi infects horses and cattle. The serovar ovis mainly infects herds of sheep and goats, and is the etiological agent of caseous lymphadenitis (CLA). Cp is prevalent in many countries, causing significant economic losses due to poor quality carcasses decrease in the production of meat, wool and milk. Methods for diagnosis and treatment of CLA are not yet effective enough due Cp have low therapeutic response and ability to persist in the environment, making it an important organism to be researched and understood the systemic level. In this regard, knowing the proteins and their interactions is crucial to understand the molecular mechanisms of the cell, being protein-protein interaction networks an important tool for this type of study. Aiming to generate the Cp interaction network, we worry about validate a methodology for the prediction of interactions with experimental and cured data publicly available. As a result, in addition to increasing the coverage of the network, we obtained an area under the curve (AUC) between 0.93 and 0.96, representing the cutoff of 0.70 a specificity of 0.95 and a sensitivity 0.90. With the validated methodology, the interaction networks were generated for nine serovar ovis Cp strains, being ~99% of interactions mapped from Corynebacterium gender, possessing 15,495 interactions conserved between strains. The shortest path and the degree interaction distribution analysis suggests the predicted networks have biological characteristics. Additionally, we compared the values of the clustering coefficient, Correlation and R2 against randomly generated networks and submit the networks generated to the Shapiro-Wilk normality test. All results show that the predicted interaction networks do not have a random distribution, suggesting the networks were not formed by spurious interactions, existing biological bias its prediction. With validated network, we selected the first 15% of the proteins with more interactions and we identified 181 essential proteins. Only the protein DNA repair protein (RecN) had no homology against database of essential genes (DEG) and other three had homology in just one DEG organism: Catalase (KatA), Endonuclease III (Nth) and trigger factor (Tig ), suggesting they may be good targets for diagnosis and drug development.
id UFMG_1ed780dcaa2a1689db8c4a2c21955553
oai_identifier_str oai:repositorio.ufmg.br:1843/BUBD-A2GJPC
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciaisBioinformáticaCorynebacterium pseudotuberculosisLinfadenite caseosaBioinformáticaProteínasRedes biológicasCorynebacterium pseudotuberculosis (cp) belongs to the group CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), is a gram-positive facultative intracellular pathogenic bacterium, have fimbriae, is non-motile, do not form capsules and not sporulate, is presented in serovar ovis and equi. The serovar equi infects horses and cattle. The serovar ovis mainly infects herds of sheep and goats, and is the etiological agent of caseous lymphadenitis (CLA). Cp is prevalent in many countries, causing significant economic losses due to poor quality carcasses decrease in the production of meat, wool and milk. Methods for diagnosis and treatment of CLA are not yet effective enough due Cp have low therapeutic response and ability to persist in the environment, making it an important organism to be researched and understood the systemic level. In this regard, knowing the proteins and their interactions is crucial to understand the molecular mechanisms of the cell, being protein-protein interaction networks an important tool for this type of study. Aiming to generate the Cp interaction network, we worry about validate a methodology for the prediction of interactions with experimental and cured data publicly available. As a result, in addition to increasing the coverage of the network, we obtained an area under the curve (AUC) between 0.93 and 0.96, representing the cutoff of 0.70 a specificity of 0.95 and a sensitivity 0.90. With the validated methodology, the interaction networks were generated for nine serovar ovis Cp strains, being ~99% of interactions mapped from Corynebacterium gender, possessing 15,495 interactions conserved between strains. The shortest path and the degree interaction distribution analysis suggests the predicted networks have biological characteristics. Additionally, we compared the values of the clustering coefficient, Correlation and R2 against randomly generated networks and submit the networks generated to the Shapiro-Wilk normality test. All results show that the predicted interaction networks do not have a random distribution, suggesting the networks were not formed by spurious interactions, existing biological bias its prediction. With validated network, we selected the first 15% of the proteins with more interactions and we identified 181 essential proteins. Only the protein DNA repair protein (RecN) had no homology against database of essential genes (DEG) and other three had homology in just one DEG organism: Catalase (KatA), Endonuclease III (Nth) and trigger factor (Tig ), suggesting they may be good targets for diagnosis and drug development.Corynebacterium pseudotuberculosis (Cp) pertence ao grupo CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), é uma bactéria patogênica intracelular facultativa, gram-positiva, possui fimbrias, porém não se move, não forma capsulas e não esporula, apresenta-se nos biovares ovis e equi. O biovar equi infecta equinos e bovinos. O biovar ovis infecta principalmente rebanhos de ovinos e caprinos, sendo o agente etiológico de linfadenite caseosa (LC). Cp é prevalente em diversos países, causando significantes perdas econômicas devido à baixa qualidade de carcaças, queda na produção de carne, lã e leite. Os métodos para diagnóstico e tratamento de LC ainda não são suficientemente eficazes devido Cp apresentar baixa resposta terapêutica e habilidade em persistir no meio ambiente e no hospedeiro, sendo importante entender a biologia deste patógeno a nível sistêmico. Neste aspecto, conhecer as proteínas e suas interações é fundamental para compreender os mecanismos moleculares da célula, sendo as redes de interação proteína-proteína uma boa ferramenta para este tipo de estudo. Visando gerar a rede de interação para Cp, nos preocupamos em validar uma metodologia para a predição de interações com dados experimentais e curados disponíveis publicamente. Como resultado, além de aumentarmos a cobertura da rede, obtivemos uma área sobre a curva (AUC) entre 0,93 e 0,96, cujo ponto de corte de 0,70 representa uma especificidade de 0,95 e a uma sensibilidade de 0,90. Com a metodologia validada, foram geradas as redes de interação para nove linhagens do biovar ovis de Cp, sendo ~99% das interações mapeadas do gênero Corynebacterium e possuindo 15.495 interações conservadas entre as linhagens. Validação quanto ao menor caminho e distribuição do grau de interação sugerem que as redes preditas possuem características de redes biológicas. Adicionalmente, comparamos os valores do Coeficiente de Clusterização, Correlação e R2 contra redes geradas aleatoriamente e submetemos as redes geradas ao teste de normalidade Shapiro-Wilk. Todos os resultados demonstraram que as redes de interação preditas não possuem uma distribuição aleatória, sugerindo que as redes não foram formadas por interações espúrias, existindo uma influência biológica em sua predição. Com as redes validadas, selecionamos os primeiros 15% das proteínas com maior número de interações e identificamos 181 proteínas essenciais. Apenas a proteína DNA repair protein (RecN) não teve homologia com a base de dados de genes essenciais (DEG) e outras três tiveram homologia em apenas um organismo em DEG: Catalase (KatA), Endonuclease III (Nth) e Trigger factor (Tig), sugerindo que podem ser bons alvos para diagnóstico ou desenvolvimento de drogas.Universidade Federal de Minas GeraisUFMGVasco Ariston de Carvalho AzevedoRafaela Salgado FerreiraEdson Luiz Folador2019-08-09T14:53:14Z2019-08-09T14:53:14Z2015-09-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/1843/BUBD-A2GJPCinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2019-11-14T12:43:26Zoai:repositorio.ufmg.br:1843/BUBD-A2GJPCRepositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2019-11-14T12:43:26Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
title Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
spellingShingle Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
Edson Luiz Folador
Bioinformática
Corynebacterium pseudotuberculosis
Linfadenite caseosa
Bioinformática
Proteínas
Redes biológicas
title_short Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
title_full Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
title_fullStr Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
title_full_unstemmed Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
title_sort Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
author Edson Luiz Folador
author_facet Edson Luiz Folador
author_role author
dc.contributor.none.fl_str_mv Vasco Ariston de Carvalho Azevedo
Rafaela Salgado Ferreira
dc.contributor.author.fl_str_mv Edson Luiz Folador
dc.subject.por.fl_str_mv Bioinformática
Corynebacterium pseudotuberculosis
Linfadenite caseosa
Bioinformática
Proteínas
Redes biológicas
topic Bioinformática
Corynebacterium pseudotuberculosis
Linfadenite caseosa
Bioinformática
Proteínas
Redes biológicas
description Corynebacterium pseudotuberculosis (cp) belongs to the group CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), is a gram-positive facultative intracellular pathogenic bacterium, have fimbriae, is non-motile, do not form capsules and not sporulate, is presented in serovar ovis and equi. The serovar equi infects horses and cattle. The serovar ovis mainly infects herds of sheep and goats, and is the etiological agent of caseous lymphadenitis (CLA). Cp is prevalent in many countries, causing significant economic losses due to poor quality carcasses decrease in the production of meat, wool and milk. Methods for diagnosis and treatment of CLA are not yet effective enough due Cp have low therapeutic response and ability to persist in the environment, making it an important organism to be researched and understood the systemic level. In this regard, knowing the proteins and their interactions is crucial to understand the molecular mechanisms of the cell, being protein-protein interaction networks an important tool for this type of study. Aiming to generate the Cp interaction network, we worry about validate a methodology for the prediction of interactions with experimental and cured data publicly available. As a result, in addition to increasing the coverage of the network, we obtained an area under the curve (AUC) between 0.93 and 0.96, representing the cutoff of 0.70 a specificity of 0.95 and a sensitivity 0.90. With the validated methodology, the interaction networks were generated for nine serovar ovis Cp strains, being ~99% of interactions mapped from Corynebacterium gender, possessing 15,495 interactions conserved between strains. The shortest path and the degree interaction distribution analysis suggests the predicted networks have biological characteristics. Additionally, we compared the values of the clustering coefficient, Correlation and R2 against randomly generated networks and submit the networks generated to the Shapiro-Wilk normality test. All results show that the predicted interaction networks do not have a random distribution, suggesting the networks were not formed by spurious interactions, existing biological bias its prediction. With validated network, we selected the first 15% of the proteins with more interactions and we identified 181 essential proteins. Only the protein DNA repair protein (RecN) had no homology against database of essential genes (DEG) and other three had homology in just one DEG organism: Catalase (KatA), Endonuclease III (Nth) and trigger factor (Tig ), suggesting they may be good targets for diagnosis and drug development.
publishDate 2015
dc.date.none.fl_str_mv 2015-09-16
2019-08-09T14:53:14Z
2019-08-09T14:53:14Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUBD-A2GJPC
url http://hdl.handle.net/1843/BUBD-A2GJPC
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
UFMG
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1816829784822382592