Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/BUBD-A2GJPC |
Resumo: | Corynebacterium pseudotuberculosis (cp) belongs to the group CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), is a gram-positive facultative intracellular pathogenic bacterium, have fimbriae, is non-motile, do not form capsules and not sporulate, is presented in serovar ovis and equi. The serovar equi infects horses and cattle. The serovar ovis mainly infects herds of sheep and goats, and is the etiological agent of caseous lymphadenitis (CLA). Cp is prevalent in many countries, causing significant economic losses due to poor quality carcasses decrease in the production of meat, wool and milk. Methods for diagnosis and treatment of CLA are not yet effective enough due Cp have low therapeutic response and ability to persist in the environment, making it an important organism to be researched and understood the systemic level. In this regard, knowing the proteins and their interactions is crucial to understand the molecular mechanisms of the cell, being protein-protein interaction networks an important tool for this type of study. Aiming to generate the Cp interaction network, we worry about validate a methodology for the prediction of interactions with experimental and cured data publicly available. As a result, in addition to increasing the coverage of the network, we obtained an area under the curve (AUC) between 0.93 and 0.96, representing the cutoff of 0.70 a specificity of 0.95 and a sensitivity 0.90. With the validated methodology, the interaction networks were generated for nine serovar ovis Cp strains, being ~99% of interactions mapped from Corynebacterium gender, possessing 15,495 interactions conserved between strains. The shortest path and the degree interaction distribution analysis suggests the predicted networks have biological characteristics. Additionally, we compared the values of the clustering coefficient, Correlation and R2 against randomly generated networks and submit the networks generated to the Shapiro-Wilk normality test. All results show that the predicted interaction networks do not have a random distribution, suggesting the networks were not formed by spurious interactions, existing biological bias its prediction. With validated network, we selected the first 15% of the proteins with more interactions and we identified 181 essential proteins. Only the protein DNA repair protein (RecN) had no homology against database of essential genes (DEG) and other three had homology in just one DEG organism: Catalase (KatA), Endonuclease III (Nth) and trigger factor (Tig ), suggesting they may be good targets for diagnosis and drug development. |
id |
UFMG_1ed780dcaa2a1689db8c4a2c21955553 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/BUBD-A2GJPC |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciaisBioinformáticaCorynebacterium pseudotuberculosisLinfadenite caseosaBioinformáticaProteínasRedes biológicasCorynebacterium pseudotuberculosis (cp) belongs to the group CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), is a gram-positive facultative intracellular pathogenic bacterium, have fimbriae, is non-motile, do not form capsules and not sporulate, is presented in serovar ovis and equi. The serovar equi infects horses and cattle. The serovar ovis mainly infects herds of sheep and goats, and is the etiological agent of caseous lymphadenitis (CLA). Cp is prevalent in many countries, causing significant economic losses due to poor quality carcasses decrease in the production of meat, wool and milk. Methods for diagnosis and treatment of CLA are not yet effective enough due Cp have low therapeutic response and ability to persist in the environment, making it an important organism to be researched and understood the systemic level. In this regard, knowing the proteins and their interactions is crucial to understand the molecular mechanisms of the cell, being protein-protein interaction networks an important tool for this type of study. Aiming to generate the Cp interaction network, we worry about validate a methodology for the prediction of interactions with experimental and cured data publicly available. As a result, in addition to increasing the coverage of the network, we obtained an area under the curve (AUC) between 0.93 and 0.96, representing the cutoff of 0.70 a specificity of 0.95 and a sensitivity 0.90. With the validated methodology, the interaction networks were generated for nine serovar ovis Cp strains, being ~99% of interactions mapped from Corynebacterium gender, possessing 15,495 interactions conserved between strains. The shortest path and the degree interaction distribution analysis suggests the predicted networks have biological characteristics. Additionally, we compared the values of the clustering coefficient, Correlation and R2 against randomly generated networks and submit the networks generated to the Shapiro-Wilk normality test. All results show that the predicted interaction networks do not have a random distribution, suggesting the networks were not formed by spurious interactions, existing biological bias its prediction. With validated network, we selected the first 15% of the proteins with more interactions and we identified 181 essential proteins. Only the protein DNA repair protein (RecN) had no homology against database of essential genes (DEG) and other three had homology in just one DEG organism: Catalase (KatA), Endonuclease III (Nth) and trigger factor (Tig ), suggesting they may be good targets for diagnosis and drug development.Corynebacterium pseudotuberculosis (Cp) pertence ao grupo CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), é uma bactéria patogênica intracelular facultativa, gram-positiva, possui fimbrias, porém não se move, não forma capsulas e não esporula, apresenta-se nos biovares ovis e equi. O biovar equi infecta equinos e bovinos. O biovar ovis infecta principalmente rebanhos de ovinos e caprinos, sendo o agente etiológico de linfadenite caseosa (LC). Cp é prevalente em diversos países, causando significantes perdas econômicas devido à baixa qualidade de carcaças, queda na produção de carne, lã e leite. Os métodos para diagnóstico e tratamento de LC ainda não são suficientemente eficazes devido Cp apresentar baixa resposta terapêutica e habilidade em persistir no meio ambiente e no hospedeiro, sendo importante entender a biologia deste patógeno a nível sistêmico. Neste aspecto, conhecer as proteínas e suas interações é fundamental para compreender os mecanismos moleculares da célula, sendo as redes de interação proteína-proteína uma boa ferramenta para este tipo de estudo. Visando gerar a rede de interação para Cp, nos preocupamos em validar uma metodologia para a predição de interações com dados experimentais e curados disponíveis publicamente. Como resultado, além de aumentarmos a cobertura da rede, obtivemos uma área sobre a curva (AUC) entre 0,93 e 0,96, cujo ponto de corte de 0,70 representa uma especificidade de 0,95 e a uma sensibilidade de 0,90. Com a metodologia validada, foram geradas as redes de interação para nove linhagens do biovar ovis de Cp, sendo ~99% das interações mapeadas do gênero Corynebacterium e possuindo 15.495 interações conservadas entre as linhagens. Validação quanto ao menor caminho e distribuição do grau de interação sugerem que as redes preditas possuem características de redes biológicas. Adicionalmente, comparamos os valores do Coeficiente de Clusterização, Correlação e R2 contra redes geradas aleatoriamente e submetemos as redes geradas ao teste de normalidade Shapiro-Wilk. Todos os resultados demonstraram que as redes de interação preditas não possuem uma distribuição aleatória, sugerindo que as redes não foram formadas por interações espúrias, existindo uma influência biológica em sua predição. Com as redes validadas, selecionamos os primeiros 15% das proteínas com maior número de interações e identificamos 181 proteínas essenciais. Apenas a proteína DNA repair protein (RecN) não teve homologia com a base de dados de genes essenciais (DEG) e outras três tiveram homologia em apenas um organismo em DEG: Catalase (KatA), Endonuclease III (Nth) e Trigger factor (Tig), sugerindo que podem ser bons alvos para diagnóstico ou desenvolvimento de drogas.Universidade Federal de Minas GeraisUFMGVasco Ariston de Carvalho AzevedoRafaela Salgado FerreiraEdson Luiz Folador2019-08-09T14:53:14Z2019-08-09T14:53:14Z2015-09-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/1843/BUBD-A2GJPCinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2019-11-14T12:43:26Zoai:repositorio.ufmg.br:1843/BUBD-A2GJPCRepositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2019-11-14T12:43:26Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.none.fl_str_mv |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais |
title |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais |
spellingShingle |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais Edson Luiz Folador Bioinformática Corynebacterium pseudotuberculosis Linfadenite caseosa Bioinformática Proteínas Redes biológicas |
title_short |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais |
title_full |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais |
title_fullStr |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais |
title_full_unstemmed |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais |
title_sort |
Validação de um método para predição de redes de interação proteína-proteína e sua aplicação em Corynebacterium pseudotuberculosis para identificar proteínas essenciais |
author |
Edson Luiz Folador |
author_facet |
Edson Luiz Folador |
author_role |
author |
dc.contributor.none.fl_str_mv |
Vasco Ariston de Carvalho Azevedo Rafaela Salgado Ferreira |
dc.contributor.author.fl_str_mv |
Edson Luiz Folador |
dc.subject.por.fl_str_mv |
Bioinformática Corynebacterium pseudotuberculosis Linfadenite caseosa Bioinformática Proteínas Redes biológicas |
topic |
Bioinformática Corynebacterium pseudotuberculosis Linfadenite caseosa Bioinformática Proteínas Redes biológicas |
description |
Corynebacterium pseudotuberculosis (cp) belongs to the group CMNR (Corynebacterium, Mycobacterium, Nocardia, Rhodococcus), is a gram-positive facultative intracellular pathogenic bacterium, have fimbriae, is non-motile, do not form capsules and not sporulate, is presented in serovar ovis and equi. The serovar equi infects horses and cattle. The serovar ovis mainly infects herds of sheep and goats, and is the etiological agent of caseous lymphadenitis (CLA). Cp is prevalent in many countries, causing significant economic losses due to poor quality carcasses decrease in the production of meat, wool and milk. Methods for diagnosis and treatment of CLA are not yet effective enough due Cp have low therapeutic response and ability to persist in the environment, making it an important organism to be researched and understood the systemic level. In this regard, knowing the proteins and their interactions is crucial to understand the molecular mechanisms of the cell, being protein-protein interaction networks an important tool for this type of study. Aiming to generate the Cp interaction network, we worry about validate a methodology for the prediction of interactions with experimental and cured data publicly available. As a result, in addition to increasing the coverage of the network, we obtained an area under the curve (AUC) between 0.93 and 0.96, representing the cutoff of 0.70 a specificity of 0.95 and a sensitivity 0.90. With the validated methodology, the interaction networks were generated for nine serovar ovis Cp strains, being ~99% of interactions mapped from Corynebacterium gender, possessing 15,495 interactions conserved between strains. The shortest path and the degree interaction distribution analysis suggests the predicted networks have biological characteristics. Additionally, we compared the values of the clustering coefficient, Correlation and R2 against randomly generated networks and submit the networks generated to the Shapiro-Wilk normality test. All results show that the predicted interaction networks do not have a random distribution, suggesting the networks were not formed by spurious interactions, existing biological bias its prediction. With validated network, we selected the first 15% of the proteins with more interactions and we identified 181 essential proteins. Only the protein DNA repair protein (RecN) had no homology against database of essential genes (DEG) and other three had homology in just one DEG organism: Catalase (KatA), Endonuclease III (Nth) and trigger factor (Tig ), suggesting they may be good targets for diagnosis and drug development. |
publishDate |
2015 |
dc.date.none.fl_str_mv |
2015-09-16 2019-08-09T14:53:14Z 2019-08-09T14:53:14Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/BUBD-A2GJPC |
url |
http://hdl.handle.net/1843/BUBD-A2GJPC |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais UFMG |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
repositorio@ufmg.br |
_version_ |
1816829784822382592 |