Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da FIOCRUZ (ARCA) |
Texto Completo: | https://www.arca.fiocruz.br/handle/icict/22997 |
Resumo: | A biologia de sistemas procura modelar sistemas complexos, usufruindo de conteúdos interdisciplinares e possibilitando a integração da informação biológica disponível sobre determinado organismo. Nesse contexto, uma das abordagens integradas é a de redes, que pode ser definida como um conjunto de entidades ou nós que se conectam e que viabilizam a integração de dados. Um exemplo são as redes de interação proteína-proteína (PPI). Os organismos modelos utilizados neste estudo pertencem ao gênero Cryptococcus spp. Aproximadamente um milhão de casos de Criptococose ocorrem no mundo e estima-se a ocorrência de 400 mil mortes anualmente. O presente trabalho teve como objetivo o emprego dessa metodologia em espécies do gênero Cryptococcus spp. depositadas em bancos de dados de domínio público, visando à análise comparativa de redes associadas à patogenia e à virulência desses organismos.Um fator crucial nas análises genômicas comparativas é a anotação funcional dos genomas estudados. Por isso, este trabalho inclui também uma etapa inicial de reanotação e anotação desses genomas. Nosso recurso básico para a geração de redes PPI são os genes preditos e nesse contexto utilizamos 12 genomas de Cryptococcus spp. Dentre as técnicas computacionais para a predição de PPI utilizamos a abordagem de coevolução. Aplicamos duas estratégias distintas que envolvem a referida abordagem. Na primeira estratégia, realiza-se o alinhamento múltiplo global das proteínas a serem comparadas e avalia-se o valor de PI. Na segunda estratégia, realiza-se uma análise combinatória de sequências par-a-par oriundas do agrupamento original. Essa etapa é seguida pela execução de um novo alinhamento múltiplo global e a posterior avaliação do valor de PI. A partir daí, torna-se possível inferir as interações proteínaproteína do organismo em estudo. Como resultado, obtiveram-se 24 redes. Calculamos as estatísticas associadas às redes, além da localização dos principais hubs. O menor e o maior número de nós obtidos das redes do grupo utilizando o agrupamento variaram de 63 a 118 e as conexões (arestas) correspondentes foram de 393 a 476. No grupo de pares do agrupamento a variação foi de 149 a 2.465 e as conexões correspondentes variaram de 1.516 a 46.468. Construímos um banco relacional em MySQL com proteínas associadas à virulência e à patogenicidade de onde foram identificadas 226.065 proteínas associadas aos termos de busca. Na primeira estratégia utilizando o valor PI do agrupamento, encontramos poucas proteínas à virulência e à patogenicidade, mas na segunda estratégia, obtivemos de nem uma proteína associadas à virulência e à patogenicidade em um organismo que não atinge humanos a 91 proteínas. Dentre elas proteínas de heat shock e proteína de resistência a múltiplas drogas 1 (MDR1). |
id |
CRUZ_7b2d818f9e7f90521a2cf8661b775612 |
---|---|
oai_identifier_str |
oai:www.arca.fiocruz.br:icict/22997 |
network_acronym_str |
CRUZ |
network_name_str |
Repositório Institucional da FIOCRUZ (ARCA) |
repository_id_str |
2135 |
spelling |
Horácio, Elvira Cynthia AlvesCaffarena, Ernesto RaulBrito, Cristiana Ferreiara AlvesPires, Douglas Eduardo ValenteFernandes, Gabriel da RochaMiranda, Antonio Basilio deRuiz, Jeronimo ConceiçãoResende, Daniela de Melo2017-10-30T18:35:24Z2017-10-30T18:35:24Z2016HORÁCIO, Elvira Cynthia Alves. Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp. 2016. 137 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2016.https://www.arca.fiocruz.br/handle/icict/22997A biologia de sistemas procura modelar sistemas complexos, usufruindo de conteúdos interdisciplinares e possibilitando a integração da informação biológica disponível sobre determinado organismo. Nesse contexto, uma das abordagens integradas é a de redes, que pode ser definida como um conjunto de entidades ou nós que se conectam e que viabilizam a integração de dados. Um exemplo são as redes de interação proteína-proteína (PPI). Os organismos modelos utilizados neste estudo pertencem ao gênero Cryptococcus spp. Aproximadamente um milhão de casos de Criptococose ocorrem no mundo e estima-se a ocorrência de 400 mil mortes anualmente. O presente trabalho teve como objetivo o emprego dessa metodologia em espécies do gênero Cryptococcus spp. depositadas em bancos de dados de domínio público, visando à análise comparativa de redes associadas à patogenia e à virulência desses organismos.Um fator crucial nas análises genômicas comparativas é a anotação funcional dos genomas estudados. Por isso, este trabalho inclui também uma etapa inicial de reanotação e anotação desses genomas. Nosso recurso básico para a geração de redes PPI são os genes preditos e nesse contexto utilizamos 12 genomas de Cryptococcus spp. Dentre as técnicas computacionais para a predição de PPI utilizamos a abordagem de coevolução. Aplicamos duas estratégias distintas que envolvem a referida abordagem. Na primeira estratégia, realiza-se o alinhamento múltiplo global das proteínas a serem comparadas e avalia-se o valor de PI. Na segunda estratégia, realiza-se uma análise combinatória de sequências par-a-par oriundas do agrupamento original. Essa etapa é seguida pela execução de um novo alinhamento múltiplo global e a posterior avaliação do valor de PI. A partir daí, torna-se possível inferir as interações proteínaproteína do organismo em estudo. Como resultado, obtiveram-se 24 redes. Calculamos as estatísticas associadas às redes, além da localização dos principais hubs. O menor e o maior número de nós obtidos das redes do grupo utilizando o agrupamento variaram de 63 a 118 e as conexões (arestas) correspondentes foram de 393 a 476. No grupo de pares do agrupamento a variação foi de 149 a 2.465 e as conexões correspondentes variaram de 1.516 a 46.468. Construímos um banco relacional em MySQL com proteínas associadas à virulência e à patogenicidade de onde foram identificadas 226.065 proteínas associadas aos termos de busca. Na primeira estratégia utilizando o valor PI do agrupamento, encontramos poucas proteínas à virulência e à patogenicidade, mas na segunda estratégia, obtivemos de nem uma proteína associadas à virulência e à patogenicidade em um organismo que não atinge humanos a 91 proteínas. Dentre elas proteínas de heat shock e proteína de resistência a múltiplas drogas 1 (MDR1).The biology of systems search for complex models, taking advantage of interdisciplinary contents and enabling the integration of available biological information on a given organism. In this context, one of the integrated approaches is networks, which can be defined as a set of entities or nodes that connect and enable integration of data. An example is how protein-protein interaction networks (PPI). The models of the organisms used in this study belong to the genus Cryptococcus spp. Approximately one million cases of Cryptococcosis occur worldwide and an estimated 400,000 deaths are estimated annually. The present work had as objective the use of the methodology in species of the genus Cryptococcus spp. Deposited in public domain databases, aiming the comparative analysis of networks associated with pathogenesis and virulence of organisms. The crucial factor for comparative genomic analysis is a functional annotation of the studied genomes. Therefore, this work also includes an initial stage of reassessment and annotation of genomes. We used the predicted gene sequences to obtain the networks, for this purpose we sought 12 genomes of Cryptococcus spp. Among the computational techniques to predict PPI we used the coevolution approach. We developed and applied two different strategies involving this approach. In the first strategy, we carried out global multiple sequence alignments of proteins and evaluated the PI value In the second strategy it was performed a pairwise combinatory analysis of sequences from the original group. This step was followed by the implementation of a new global multiple alignment and the subsequent assessment of the PI value. From there, it becomes possible to infer how protein-protein interactions of the organism under study. As a result, 24 networks were obtained. Calculations such as statistics associated with networks, as well as the location of the main hubs. The lowest and the highest number of nodes obtained in the cluster with the varied clustering from 63 to 118 and the corresponding connections (edges) were from 393 to 476. There is no comparison group of variables from 149 to 2465 and the corresponding connections varied from 1,516 to 46,468. We have a MySQL relational database with proteins associated with virulence and pathogenicity from which 226,065 proteins associated with search terms were identified. In the first use of value-added measures, there are few proteins for virulence and pathogenicity, they have a second strategy, they obtain a protein associated with virulence and they are pathogenic in a non-human body. Among them, thermal shock and multiple drug resistance protein 1 (MDR1).2017-10-16Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.porCryptococcus sppInterações proteína-proteínaRedes de interaçãoInterações proteína-proteínaCryptococcus sppRedes de interaçãoPredição computacional das interações proteína-proteína em espécies do gênero Cryptococcus sppinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis2016Pós - Graduação em Biologia Computacional e SistemasFundação Oswaldo Cruz. Instituto Oswaldo CruzMestrado AcadêmicoRio de Janeiro/RJPrograma de Pós-Graduação Biologia Computacional e Sistemasinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/22997/1/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALelvira_horacio_ioc_mest_2016.pdfelvira_horacio_ioc_mest_2016.pdfapplication/pdf10524873https://www.arca.fiocruz.br/bitstream/icict/22997/2/elvira_horacio_ioc_mest_2016.pdf4e0d050bbd0c43224578df45799f630eMD52TEXTelvira_horacio_ioc_mest_2016.pdf.txtelvira_horacio_ioc_mest_2016.pdf.txtExtracted texttext/plain177750https://www.arca.fiocruz.br/bitstream/icict/22997/3/elvira_horacio_ioc_mest_2016.pdf.txt47168ace7bc725f61a9e0cd9f385b777MD53icict/229972021-02-10 19:38:02.368oai:www.arca.fiocruz.br:icict/22997Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352021-02-10T22:38:02Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false |
dc.title.pt_BR.fl_str_mv |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp |
title |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp |
spellingShingle |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp Horácio, Elvira Cynthia Alves Cryptococcus spp Interações proteína-proteína Redes de interação Interações proteína-proteína Cryptococcus spp Redes de interação |
title_short |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp |
title_full |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp |
title_fullStr |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp |
title_full_unstemmed |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp |
title_sort |
Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp |
author |
Horácio, Elvira Cynthia Alves |
author_facet |
Horácio, Elvira Cynthia Alves |
author_role |
author |
dc.contributor.member.none.fl_str_mv |
Caffarena, Ernesto Raul Brito, Cristiana Ferreiara Alves Pires, Douglas Eduardo Valente Fernandes, Gabriel da Rocha Miranda, Antonio Basilio de |
dc.contributor.author.fl_str_mv |
Horácio, Elvira Cynthia Alves |
dc.contributor.advisor1.fl_str_mv |
Ruiz, Jeronimo Conceição Resende, Daniela de Melo |
contributor_str_mv |
Ruiz, Jeronimo Conceição Resende, Daniela de Melo |
dc.subject.other.pt_BR.fl_str_mv |
Cryptococcus spp Interações proteína-proteína Redes de interação |
topic |
Cryptococcus spp Interações proteína-proteína Redes de interação Interações proteína-proteína Cryptococcus spp Redes de interação |
dc.subject.decs.pt_BR.fl_str_mv |
Interações proteína-proteína Cryptococcus spp Redes de interação |
description |
A biologia de sistemas procura modelar sistemas complexos, usufruindo de conteúdos interdisciplinares e possibilitando a integração da informação biológica disponível sobre determinado organismo. Nesse contexto, uma das abordagens integradas é a de redes, que pode ser definida como um conjunto de entidades ou nós que se conectam e que viabilizam a integração de dados. Um exemplo são as redes de interação proteína-proteína (PPI). Os organismos modelos utilizados neste estudo pertencem ao gênero Cryptococcus spp. Aproximadamente um milhão de casos de Criptococose ocorrem no mundo e estima-se a ocorrência de 400 mil mortes anualmente. O presente trabalho teve como objetivo o emprego dessa metodologia em espécies do gênero Cryptococcus spp. depositadas em bancos de dados de domínio público, visando à análise comparativa de redes associadas à patogenia e à virulência desses organismos.Um fator crucial nas análises genômicas comparativas é a anotação funcional dos genomas estudados. Por isso, este trabalho inclui também uma etapa inicial de reanotação e anotação desses genomas. Nosso recurso básico para a geração de redes PPI são os genes preditos e nesse contexto utilizamos 12 genomas de Cryptococcus spp. Dentre as técnicas computacionais para a predição de PPI utilizamos a abordagem de coevolução. Aplicamos duas estratégias distintas que envolvem a referida abordagem. Na primeira estratégia, realiza-se o alinhamento múltiplo global das proteínas a serem comparadas e avalia-se o valor de PI. Na segunda estratégia, realiza-se uma análise combinatória de sequências par-a-par oriundas do agrupamento original. Essa etapa é seguida pela execução de um novo alinhamento múltiplo global e a posterior avaliação do valor de PI. A partir daí, torna-se possível inferir as interações proteínaproteína do organismo em estudo. Como resultado, obtiveram-se 24 redes. Calculamos as estatísticas associadas às redes, além da localização dos principais hubs. O menor e o maior número de nós obtidos das redes do grupo utilizando o agrupamento variaram de 63 a 118 e as conexões (arestas) correspondentes foram de 393 a 476. No grupo de pares do agrupamento a variação foi de 149 a 2.465 e as conexões correspondentes variaram de 1.516 a 46.468. Construímos um banco relacional em MySQL com proteínas associadas à virulência e à patogenicidade de onde foram identificadas 226.065 proteínas associadas aos termos de busca. Na primeira estratégia utilizando o valor PI do agrupamento, encontramos poucas proteínas à virulência e à patogenicidade, mas na segunda estratégia, obtivemos de nem uma proteína associadas à virulência e à patogenicidade em um organismo que não atinge humanos a 91 proteínas. Dentre elas proteínas de heat shock e proteína de resistência a múltiplas drogas 1 (MDR1). |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016 |
dc.date.accessioned.fl_str_mv |
2017-10-30T18:35:24Z |
dc.date.available.fl_str_mv |
2017-10-30T18:35:24Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
HORÁCIO, Elvira Cynthia Alves. Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp. 2016. 137 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2016. |
dc.identifier.uri.fl_str_mv |
https://www.arca.fiocruz.br/handle/icict/22997 |
identifier_str_mv |
HORÁCIO, Elvira Cynthia Alves. Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp. 2016. 137 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2016. |
url |
https://www.arca.fiocruz.br/handle/icict/22997 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da FIOCRUZ (ARCA) instname:Fundação Oswaldo Cruz (FIOCRUZ) instacron:FIOCRUZ |
instname_str |
Fundação Oswaldo Cruz (FIOCRUZ) |
instacron_str |
FIOCRUZ |
institution |
FIOCRUZ |
reponame_str |
Repositório Institucional da FIOCRUZ (ARCA) |
collection |
Repositório Institucional da FIOCRUZ (ARCA) |
bitstream.url.fl_str_mv |
https://www.arca.fiocruz.br/bitstream/icict/22997/1/license.txt https://www.arca.fiocruz.br/bitstream/icict/22997/2/elvira_horacio_ioc_mest_2016.pdf https://www.arca.fiocruz.br/bitstream/icict/22997/3/elvira_horacio_ioc_mest_2016.pdf.txt |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 4e0d050bbd0c43224578df45799f630e 47168ace7bc725f61a9e0cd9f385b777 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ) |
repository.mail.fl_str_mv |
repositorio.arca@fiocruz.br |
_version_ |
1813009227905499136 |