Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp

Detalhes bibliográficos
Autor(a) principal: Horácio, Elvira Cynthia Alves
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
Texto Completo: https://www.arca.fiocruz.br/handle/icict/22997
Resumo: A biologia de sistemas procura modelar sistemas complexos, usufruindo de conteúdos interdisciplinares e possibilitando a integração da informação biológica disponível sobre determinado organismo. Nesse contexto, uma das abordagens integradas é a de redes, que pode ser definida como um conjunto de entidades ou nós que se conectam e que viabilizam a integração de dados. Um exemplo são as redes de interação proteína-proteína (PPI). Os organismos modelos utilizados neste estudo pertencem ao gênero Cryptococcus spp. Aproximadamente um milhão de casos de Criptococose ocorrem no mundo e estima-se a ocorrência de 400 mil mortes anualmente. O presente trabalho teve como objetivo o emprego dessa metodologia em espécies do gênero Cryptococcus spp. depositadas em bancos de dados de domínio público, visando à análise comparativa de redes associadas à patogenia e à virulência desses organismos.Um fator crucial nas análises genômicas comparativas é a anotação funcional dos genomas estudados. Por isso, este trabalho inclui também uma etapa inicial de reanotação e anotação desses genomas. Nosso recurso básico para a geração de redes PPI são os genes preditos e nesse contexto utilizamos 12 genomas de Cryptococcus spp. Dentre as técnicas computacionais para a predição de PPI utilizamos a abordagem de coevolução. Aplicamos duas estratégias distintas que envolvem a referida abordagem. Na primeira estratégia, realiza-se o alinhamento múltiplo global das proteínas a serem comparadas e avalia-se o valor de PI. Na segunda estratégia, realiza-se uma análise combinatória de sequências par-a-par oriundas do agrupamento original. Essa etapa é seguida pela execução de um novo alinhamento múltiplo global e a posterior avaliação do valor de PI. A partir daí, torna-se possível inferir as interações proteínaproteína do organismo em estudo. Como resultado, obtiveram-se 24 redes. Calculamos as estatísticas associadas às redes, além da localização dos principais hubs. O menor e o maior número de nós obtidos das redes do grupo utilizando o agrupamento variaram de 63 a 118 e as conexões (arestas) correspondentes foram de 393 a 476. No grupo de pares do agrupamento a variação foi de 149 a 2.465 e as conexões correspondentes variaram de 1.516 a 46.468. Construímos um banco relacional em MySQL com proteínas associadas à virulência e à patogenicidade de onde foram identificadas 226.065 proteínas associadas aos termos de busca. Na primeira estratégia utilizando o valor PI do agrupamento, encontramos poucas proteínas à virulência e à patogenicidade, mas na segunda estratégia, obtivemos de nem uma proteína associadas à virulência e à patogenicidade em um organismo que não atinge humanos a 91 proteínas. Dentre elas proteínas de heat shock e proteína de resistência a múltiplas drogas 1 (MDR1).
id CRUZ_7b2d818f9e7f90521a2cf8661b775612
oai_identifier_str oai:www.arca.fiocruz.br:icict/22997
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Horácio, Elvira Cynthia AlvesCaffarena, Ernesto RaulBrito, Cristiana Ferreiara AlvesPires, Douglas Eduardo ValenteFernandes, Gabriel da RochaMiranda, Antonio Basilio deRuiz, Jeronimo ConceiçãoResende, Daniela de Melo2017-10-30T18:35:24Z2017-10-30T18:35:24Z2016HORÁCIO, Elvira Cynthia Alves. Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp. 2016. 137 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2016.https://www.arca.fiocruz.br/handle/icict/22997A biologia de sistemas procura modelar sistemas complexos, usufruindo de conteúdos interdisciplinares e possibilitando a integração da informação biológica disponível sobre determinado organismo. Nesse contexto, uma das abordagens integradas é a de redes, que pode ser definida como um conjunto de entidades ou nós que se conectam e que viabilizam a integração de dados. Um exemplo são as redes de interação proteína-proteína (PPI). Os organismos modelos utilizados neste estudo pertencem ao gênero Cryptococcus spp. Aproximadamente um milhão de casos de Criptococose ocorrem no mundo e estima-se a ocorrência de 400 mil mortes anualmente. O presente trabalho teve como objetivo o emprego dessa metodologia em espécies do gênero Cryptococcus spp. depositadas em bancos de dados de domínio público, visando à análise comparativa de redes associadas à patogenia e à virulência desses organismos.Um fator crucial nas análises genômicas comparativas é a anotação funcional dos genomas estudados. Por isso, este trabalho inclui também uma etapa inicial de reanotação e anotação desses genomas. Nosso recurso básico para a geração de redes PPI são os genes preditos e nesse contexto utilizamos 12 genomas de Cryptococcus spp. Dentre as técnicas computacionais para a predição de PPI utilizamos a abordagem de coevolução. Aplicamos duas estratégias distintas que envolvem a referida abordagem. Na primeira estratégia, realiza-se o alinhamento múltiplo global das proteínas a serem comparadas e avalia-se o valor de PI. Na segunda estratégia, realiza-se uma análise combinatória de sequências par-a-par oriundas do agrupamento original. Essa etapa é seguida pela execução de um novo alinhamento múltiplo global e a posterior avaliação do valor de PI. A partir daí, torna-se possível inferir as interações proteínaproteína do organismo em estudo. Como resultado, obtiveram-se 24 redes. Calculamos as estatísticas associadas às redes, além da localização dos principais hubs. O menor e o maior número de nós obtidos das redes do grupo utilizando o agrupamento variaram de 63 a 118 e as conexões (arestas) correspondentes foram de 393 a 476. No grupo de pares do agrupamento a variação foi de 149 a 2.465 e as conexões correspondentes variaram de 1.516 a 46.468. Construímos um banco relacional em MySQL com proteínas associadas à virulência e à patogenicidade de onde foram identificadas 226.065 proteínas associadas aos termos de busca. Na primeira estratégia utilizando o valor PI do agrupamento, encontramos poucas proteínas à virulência e à patogenicidade, mas na segunda estratégia, obtivemos de nem uma proteína associadas à virulência e à patogenicidade em um organismo que não atinge humanos a 91 proteínas. Dentre elas proteínas de heat shock e proteína de resistência a múltiplas drogas 1 (MDR1).The biology of systems search for complex models, taking advantage of interdisciplinary contents and enabling the integration of available biological information on a given organism. In this context, one of the integrated approaches is networks, which can be defined as a set of entities or nodes that connect and enable integration of data. An example is how protein-protein interaction networks (PPI). The models of the organisms used in this study belong to the genus Cryptococcus spp. Approximately one million cases of Cryptococcosis occur worldwide and an estimated 400,000 deaths are estimated annually. The present work had as objective the use of the methodology in species of the genus Cryptococcus spp. Deposited in public domain databases, aiming the comparative analysis of networks associated with pathogenesis and virulence of organisms. The crucial factor for comparative genomic analysis is a functional annotation of the studied genomes. Therefore, this work also includes an initial stage of reassessment and annotation of genomes. We used the predicted gene sequences to obtain the networks, for this purpose we sought 12 genomes of Cryptococcus spp. Among the computational techniques to predict PPI we used the coevolution approach. We developed and applied two different strategies involving this approach. In the first strategy, we carried out global multiple sequence alignments of proteins and evaluated the PI value In the second strategy it was performed a pairwise combinatory analysis of sequences from the original group. This step was followed by the implementation of a new global multiple alignment and the subsequent assessment of the PI value. From there, it becomes possible to infer how protein-protein interactions of the organism under study. As a result, 24 networks were obtained. Calculations such as statistics associated with networks, as well as the location of the main hubs. The lowest and the highest number of nodes obtained in the cluster with the varied clustering from 63 to 118 and the corresponding connections (edges) were from 393 to 476. There is no comparison group of variables from 149 to 2465 and the corresponding connections varied from 1,516 to 46,468. We have a MySQL relational database with proteins associated with virulence and pathogenicity from which 226,065 proteins associated with search terms were identified. In the first use of value-added measures, there are few proteins for virulence and pathogenicity, they have a second strategy, they obtain a protein associated with virulence and they are pathogenic in a non-human body. Among them, thermal shock and multiple drug resistance protein 1 (MDR1).2017-10-16Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.porCryptococcus sppInterações proteína-proteínaRedes de interaçãoInterações proteína-proteínaCryptococcus sppRedes de interaçãoPredição computacional das interações proteína-proteína em espécies do gênero Cryptococcus sppinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis2016Pós - Graduação em Biologia Computacional e SistemasFundação Oswaldo Cruz. Instituto Oswaldo CruzMestrado AcadêmicoRio de Janeiro/RJPrograma de Pós-Graduação Biologia Computacional e Sistemasinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/22997/1/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALelvira_horacio_ioc_mest_2016.pdfelvira_horacio_ioc_mest_2016.pdfapplication/pdf10524873https://www.arca.fiocruz.br/bitstream/icict/22997/2/elvira_horacio_ioc_mest_2016.pdf4e0d050bbd0c43224578df45799f630eMD52TEXTelvira_horacio_ioc_mest_2016.pdf.txtelvira_horacio_ioc_mest_2016.pdf.txtExtracted texttext/plain177750https://www.arca.fiocruz.br/bitstream/icict/22997/3/elvira_horacio_ioc_mest_2016.pdf.txt47168ace7bc725f61a9e0cd9f385b777MD53icict/229972021-02-10 19:38:02.368oai:www.arca.fiocruz.br:icict/22997Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352021-02-10T22:38:02Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false
dc.title.pt_BR.fl_str_mv Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
title Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
spellingShingle Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
Horácio, Elvira Cynthia Alves
Cryptococcus spp
Interações proteína-proteína
Redes de interação
Interações proteína-proteína
Cryptococcus spp
Redes de interação
title_short Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
title_full Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
title_fullStr Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
title_full_unstemmed Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
title_sort Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp
author Horácio, Elvira Cynthia Alves
author_facet Horácio, Elvira Cynthia Alves
author_role author
dc.contributor.member.none.fl_str_mv Caffarena, Ernesto Raul
Brito, Cristiana Ferreiara Alves
Pires, Douglas Eduardo Valente
Fernandes, Gabriel da Rocha
Miranda, Antonio Basilio de
dc.contributor.author.fl_str_mv Horácio, Elvira Cynthia Alves
dc.contributor.advisor1.fl_str_mv Ruiz, Jeronimo Conceição
Resende, Daniela de Melo
contributor_str_mv Ruiz, Jeronimo Conceição
Resende, Daniela de Melo
dc.subject.other.pt_BR.fl_str_mv Cryptococcus spp
Interações proteína-proteína
Redes de interação
topic Cryptococcus spp
Interações proteína-proteína
Redes de interação
Interações proteína-proteína
Cryptococcus spp
Redes de interação
dc.subject.decs.pt_BR.fl_str_mv Interações proteína-proteína
Cryptococcus spp
Redes de interação
description A biologia de sistemas procura modelar sistemas complexos, usufruindo de conteúdos interdisciplinares e possibilitando a integração da informação biológica disponível sobre determinado organismo. Nesse contexto, uma das abordagens integradas é a de redes, que pode ser definida como um conjunto de entidades ou nós que se conectam e que viabilizam a integração de dados. Um exemplo são as redes de interação proteína-proteína (PPI). Os organismos modelos utilizados neste estudo pertencem ao gênero Cryptococcus spp. Aproximadamente um milhão de casos de Criptococose ocorrem no mundo e estima-se a ocorrência de 400 mil mortes anualmente. O presente trabalho teve como objetivo o emprego dessa metodologia em espécies do gênero Cryptococcus spp. depositadas em bancos de dados de domínio público, visando à análise comparativa de redes associadas à patogenia e à virulência desses organismos.Um fator crucial nas análises genômicas comparativas é a anotação funcional dos genomas estudados. Por isso, este trabalho inclui também uma etapa inicial de reanotação e anotação desses genomas. Nosso recurso básico para a geração de redes PPI são os genes preditos e nesse contexto utilizamos 12 genomas de Cryptococcus spp. Dentre as técnicas computacionais para a predição de PPI utilizamos a abordagem de coevolução. Aplicamos duas estratégias distintas que envolvem a referida abordagem. Na primeira estratégia, realiza-se o alinhamento múltiplo global das proteínas a serem comparadas e avalia-se o valor de PI. Na segunda estratégia, realiza-se uma análise combinatória de sequências par-a-par oriundas do agrupamento original. Essa etapa é seguida pela execução de um novo alinhamento múltiplo global e a posterior avaliação do valor de PI. A partir daí, torna-se possível inferir as interações proteínaproteína do organismo em estudo. Como resultado, obtiveram-se 24 redes. Calculamos as estatísticas associadas às redes, além da localização dos principais hubs. O menor e o maior número de nós obtidos das redes do grupo utilizando o agrupamento variaram de 63 a 118 e as conexões (arestas) correspondentes foram de 393 a 476. No grupo de pares do agrupamento a variação foi de 149 a 2.465 e as conexões correspondentes variaram de 1.516 a 46.468. Construímos um banco relacional em MySQL com proteínas associadas à virulência e à patogenicidade de onde foram identificadas 226.065 proteínas associadas aos termos de busca. Na primeira estratégia utilizando o valor PI do agrupamento, encontramos poucas proteínas à virulência e à patogenicidade, mas na segunda estratégia, obtivemos de nem uma proteína associadas à virulência e à patogenicidade em um organismo que não atinge humanos a 91 proteínas. Dentre elas proteínas de heat shock e proteína de resistência a múltiplas drogas 1 (MDR1).
publishDate 2016
dc.date.issued.fl_str_mv 2016
dc.date.accessioned.fl_str_mv 2017-10-30T18:35:24Z
dc.date.available.fl_str_mv 2017-10-30T18:35:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv HORÁCIO, Elvira Cynthia Alves. Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp. 2016. 137 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2016.
dc.identifier.uri.fl_str_mv https://www.arca.fiocruz.br/handle/icict/22997
identifier_str_mv HORÁCIO, Elvira Cynthia Alves. Predição computacional das interações proteína-proteína em espécies do gênero Cryptococcus spp. 2016. 137 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2016.
url https://www.arca.fiocruz.br/handle/icict/22997
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://www.arca.fiocruz.br/bitstream/icict/22997/1/license.txt
https://www.arca.fiocruz.br/bitstream/icict/22997/2/elvira_horacio_ioc_mest_2016.pdf
https://www.arca.fiocruz.br/bitstream/icict/22997/3/elvira_horacio_ioc_mest_2016.pdf.txt
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
4e0d050bbd0c43224578df45799f630e
47168ace7bc725f61a9e0cd9f385b777
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1813009227905499136