De Supergrupos a Superfamílias, um estudo de homologia em protozoários

Detalhes bibliográficos
Autor(a) principal: Campos, Darueck Acácio
Data de Publicação: 2018
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
Texto Completo: https://www.arca.fiocruz.br/handle/icict/30225
Resumo: Protozoários patogênicos causam doenças importantes em países tropicais, como malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase, que em conjunto ameaçam milhões de pessoas em todo o mundo. Além disso, a maioria das doenças parasitárias causadas por protozoários são zoonóticas. Compreender a biologia desses organismos é crucial para combater as doenças que eles causam e estudos de genômica comparativa podem ser úteis para entender a relação evolutiva entre eles. Usando inferência de genômica comparativa e homologia, o presente estudo contemplou três espécies de protozoários de diferentes filos: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) e Trypanosoma grayi (Euglenozoa), escolhidos por serem patógenos ainda pouco estudados e pela distância genética entre eles. A tese pode ser dividida em 3 partes. Numa primeira parte os programas de inferência de homologia OMA e OrthoMCL foram utilizados para inferir genes homólogos e seus resultados foram comparados e separados em 3 categorias de acordo com o nível de concordância entre eles, com ênfase na identificação de grupos homólogos com maior distância evolutiva e na identificação de multidomínios CDD (Conserved Domain Database) e Pfam-A (Pfam protein families database) Na segunda parte, propomos uma nova abordagem para a identificação de homólogos, com base na definição de "Supergrupos" homólogos, formados pela reconciliação dos resultados de ambos os programas; usando como critério para inferência a interseção de proteínas e para sua validação critérios de alta estringência, onde todas as proteínas (100%) do Supergrupo devem (a) ter o mesmo domínio conservado (CDD) identificado ou (b) pertencerem à mesma família de proteínas (Pfam-A). Na terceira e última parte, foi feita uma busca por genes homólogos distantes entre os mesmos protozoários de diferentes filos utilizados no primeiro e no segundo estudo utilizando comparação entre perfis do Modelo Oculto de Markov (pHMM - pHMM) com o programa de inferência de homologia COMA, visando a identificação de superfamílias de proteínas utilizando a base de dados de famílias e superfamílias de proteínas SUPERFAMILY. Nossos resultados mostraram que foi possível inferir novos grupos de proteínas homólogas utilizando as abordagens de reconciliação (Supergrupos homólogos) e de comparação pHMM \2013 pHMM (Novos grupos homólogos distantes).
id CRUZ_feb83fd47c9da0c7755a80c5c783b803
oai_identifier_str oai:www.arca.fiocruz.br:icict/30225
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Campos, Darueck AcácioRivera Davila, Alberto Martin2018-11-27T10:24:23Z2018-11-27T10:24:23Z2018CAMPOS, Darueck Acácio. De Supergrupos a Superfamílias, um estudo de homologia em protozoários. 2018. 132 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2018.https://www.arca.fiocruz.br/handle/icict/30225Protozoários patogênicos causam doenças importantes em países tropicais, como malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase, que em conjunto ameaçam milhões de pessoas em todo o mundo. Além disso, a maioria das doenças parasitárias causadas por protozoários são zoonóticas. Compreender a biologia desses organismos é crucial para combater as doenças que eles causam e estudos de genômica comparativa podem ser úteis para entender a relação evolutiva entre eles. Usando inferência de genômica comparativa e homologia, o presente estudo contemplou três espécies de protozoários de diferentes filos: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) e Trypanosoma grayi (Euglenozoa), escolhidos por serem patógenos ainda pouco estudados e pela distância genética entre eles. A tese pode ser dividida em 3 partes. Numa primeira parte os programas de inferência de homologia OMA e OrthoMCL foram utilizados para inferir genes homólogos e seus resultados foram comparados e separados em 3 categorias de acordo com o nível de concordância entre eles, com ênfase na identificação de grupos homólogos com maior distância evolutiva e na identificação de multidomínios CDD (Conserved Domain Database) e Pfam-A (Pfam protein families database) Na segunda parte, propomos uma nova abordagem para a identificação de homólogos, com base na definição de "Supergrupos" homólogos, formados pela reconciliação dos resultados de ambos os programas; usando como critério para inferência a interseção de proteínas e para sua validação critérios de alta estringência, onde todas as proteínas (100%) do Supergrupo devem (a) ter o mesmo domínio conservado (CDD) identificado ou (b) pertencerem à mesma família de proteínas (Pfam-A). Na terceira e última parte, foi feita uma busca por genes homólogos distantes entre os mesmos protozoários de diferentes filos utilizados no primeiro e no segundo estudo utilizando comparação entre perfis do Modelo Oculto de Markov (pHMM - pHMM) com o programa de inferência de homologia COMA, visando a identificação de superfamílias de proteínas utilizando a base de dados de famílias e superfamílias de proteínas SUPERFAMILY. Nossos resultados mostraram que foi possível inferir novos grupos de proteínas homólogas utilizando as abordagens de reconciliação (Supergrupos homólogos) e de comparação pHMM \2013 pHMM (Novos grupos homólogos distantes).Pathogenic protozoa cause major diseases in tropical countries, such as malaria, sleeping sickness, Chagas disease, leishmaniasis, amebiasis and giardiasis, which together threaten millions of people worldwide. In addition, most parasitic diseases caused by protozoa are zoonotic. Understanding the biology of these organisms is crucial in combating the diseases they cause, and studies of comparative genomics may be helpful in understanding the evolutionary relationship between them. Using comparative genomic inference and homology, the present study aimed at three protozoan species of different phyla: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) and Trypanosoma grayi (Euglenozoa), chosen as pathogens that have not yet been studied and the genetic distance between them. The thesis can be divided into 3 parts. In a first part the inference programs OMA and OrthoMCL were used to infer homologous genes and their results were compared and separated into 3 categories according to the level of agreement between them, with emphasis on the identification of homologous groups with greater evolutionary distance and in the CDD (Conserved Domain Database) and Pfam-A (Pfam protein families database) multidomain identification In the second part, we propose a new approach for the identification of homologues, based on the definition of homologous "Supergroups", formed by the reconciliation of the results of both programs; Using as criterion for inference the intersection of proteins and for their validation criteria of high stringency, where all proteins (100%) of the Supergroup must (a) have the same conserved domain (CDD) identified or (b) belong to the same protein family (Pfam-A). In the third and final part, a search was made for distant homologous genes between the same protozoa of different phyla used in the first and second studies using a comparison of profiles of the Occult Markov Model (pHMM - pHMM), with the inference program COMA, aiming at the identification of superfamilies of proteins using the database of families and superfamilies of proteins SUPERFAMILY. Our results showed that it was possible to infer new groups of homologous proteins using the reconciliation (Supergroup homologous) and the pHMM - pHMM (New distant homologous groups) approaches.Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil.porHomologia de GenesGenômicaGenoma de ProtozoárioMetodologias ComputacionaisDe Supergrupos a Superfamílias, um estudo de homologia em protozoáriosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis2018Instituto Oswaldo CruzFundação Oswaldo CruzRio de JaneiroPrograma de Pós-Graduação em Biologia Computacional e Sistemasinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/30225/1/license.txt8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALdarueck_campos_ioc_dout_2018.pdfapplication/pdf11019587https://www.arca.fiocruz.br/bitstream/icict/30225/2/darueck_campos_ioc_dout_2018.pdfcd288d029fb3cca6d2e3e6fd9d29ecfbMD52TEXTdarueck_campos_ioc_dout_2018.pdf.txtdarueck_campos_ioc_dout_2018.pdf.txtExtracted texttext/plain182012https://www.arca.fiocruz.br/bitstream/icict/30225/3/darueck_campos_ioc_dout_2018.pdf.txt1a067679a6fd42dad67475a248a34453MD53icict/302252022-06-24 12:17:43.129oai:www.arca.fiocruz.br:icict/30225Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352022-06-24T15:17:43Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false
dc.title.pt_BR.fl_str_mv De Supergrupos a Superfamílias, um estudo de homologia em protozoários
title De Supergrupos a Superfamílias, um estudo de homologia em protozoários
spellingShingle De Supergrupos a Superfamílias, um estudo de homologia em protozoários
Campos, Darueck Acácio
Homologia de Genes
Genômica
Genoma de Protozoário
Metodologias Computacionais
title_short De Supergrupos a Superfamílias, um estudo de homologia em protozoários
title_full De Supergrupos a Superfamílias, um estudo de homologia em protozoários
title_fullStr De Supergrupos a Superfamílias, um estudo de homologia em protozoários
title_full_unstemmed De Supergrupos a Superfamílias, um estudo de homologia em protozoários
title_sort De Supergrupos a Superfamílias, um estudo de homologia em protozoários
author Campos, Darueck Acácio
author_facet Campos, Darueck Acácio
author_role author
dc.contributor.author.fl_str_mv Campos, Darueck Acácio
dc.contributor.advisor1.fl_str_mv Rivera Davila, Alberto Martin
contributor_str_mv Rivera Davila, Alberto Martin
dc.subject.other.pt_BR.fl_str_mv Homologia de Genes
Genômica
Genoma de Protozoário
topic Homologia de Genes
Genômica
Genoma de Protozoário
Metodologias Computacionais
dc.subject.decs.pt_BR.fl_str_mv Metodologias Computacionais
description Protozoários patogênicos causam doenças importantes em países tropicais, como malária, doença do sono, doença de Chagas, leishmaniose, amebíase e giardíase, que em conjunto ameaçam milhões de pessoas em todo o mundo. Além disso, a maioria das doenças parasitárias causadas por protozoários são zoonóticas. Compreender a biologia desses organismos é crucial para combater as doenças que eles causam e estudos de genômica comparativa podem ser úteis para entender a relação evolutiva entre eles. Usando inferência de genômica comparativa e homologia, o presente estudo contemplou três espécies de protozoários de diferentes filos: Cryptosporidium muris (Apicomplexa), Entamoeba invadens (Amoebozoa) e Trypanosoma grayi (Euglenozoa), escolhidos por serem patógenos ainda pouco estudados e pela distância genética entre eles. A tese pode ser dividida em 3 partes. Numa primeira parte os programas de inferência de homologia OMA e OrthoMCL foram utilizados para inferir genes homólogos e seus resultados foram comparados e separados em 3 categorias de acordo com o nível de concordância entre eles, com ênfase na identificação de grupos homólogos com maior distância evolutiva e na identificação de multidomínios CDD (Conserved Domain Database) e Pfam-A (Pfam protein families database) Na segunda parte, propomos uma nova abordagem para a identificação de homólogos, com base na definição de "Supergrupos" homólogos, formados pela reconciliação dos resultados de ambos os programas; usando como critério para inferência a interseção de proteínas e para sua validação critérios de alta estringência, onde todas as proteínas (100%) do Supergrupo devem (a) ter o mesmo domínio conservado (CDD) identificado ou (b) pertencerem à mesma família de proteínas (Pfam-A). Na terceira e última parte, foi feita uma busca por genes homólogos distantes entre os mesmos protozoários de diferentes filos utilizados no primeiro e no segundo estudo utilizando comparação entre perfis do Modelo Oculto de Markov (pHMM - pHMM) com o programa de inferência de homologia COMA, visando a identificação de superfamílias de proteínas utilizando a base de dados de famílias e superfamílias de proteínas SUPERFAMILY. Nossos resultados mostraram que foi possível inferir novos grupos de proteínas homólogas utilizando as abordagens de reconciliação (Supergrupos homólogos) e de comparação pHMM \2013 pHMM (Novos grupos homólogos distantes).
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-11-27T10:24:23Z
dc.date.available.fl_str_mv 2018-11-27T10:24:23Z
dc.date.issued.fl_str_mv 2018
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CAMPOS, Darueck Acácio. De Supergrupos a Superfamílias, um estudo de homologia em protozoários. 2018. 132 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2018.
dc.identifier.uri.fl_str_mv https://www.arca.fiocruz.br/handle/icict/30225
identifier_str_mv CAMPOS, Darueck Acácio. De Supergrupos a Superfamílias, um estudo de homologia em protozoários. 2018. 132 f. Tese (Doutorado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2018.
url https://www.arca.fiocruz.br/handle/icict/30225
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://www.arca.fiocruz.br/bitstream/icict/30225/1/license.txt
https://www.arca.fiocruz.br/bitstream/icict/30225/2/darueck_campos_ioc_dout_2018.pdf
https://www.arca.fiocruz.br/bitstream/icict/30225/3/darueck_campos_ioc_dout_2018.pdf.txt
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
cd288d029fb3cca6d2e3e6fd9d29ecfb
1a067679a6fd42dad67475a248a34453
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1798324725161656320