Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários

Detalhes bibliográficos
Autor(a) principal: Kotowski Filho, Nelson Peixoto
Data de Publicação: 2015
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
Texto Completo: https://www.arca.fiocruz.br/handle/icict/13624
Resumo: A inferência de homologia entre organismos é uma atividade da genômica comparativa que possibilita compreender melhor a relação entre os mesmos e, por conseguinte, sua distância evolutiva. Especificamente, a identificação de genes ortólogos, ou seja, aqueles que têm sua origem em um ancestral comum, permite oferecer melhorias na anotação funcional de genes, uma vez que genes ortólogos tendem a ter sua função conservada. Com a crescente disponibilidade de genomas através de técnicas de NGS, a construção e atualização de bases de dados de ortólogos representam um desafio constante, pois demandam o estudo e identificação das relações entre os genes de tais organismos, em um volume de dados cada vez mais extenso e a um custo computacional cada vez mais elevado. Nesta tese propomos a solução para nuvem computacional elastic-OrthoSearch, um workflow científico de genômica comparativa inspirado no OrthoSearch, responsável pela inferência de homologia entre organismos com o uso de abordagem baseada em melhores hits recíprocos e perfis de Markov. Também propomos uma metodologia para criação de bases de ortólogos construída através do reuso do OrthoSearch. Esta metodologia mostrou-se capaz de alavancar a oferta de grupos ortólogos e assim auxiliar, por exemplo, na identificação de alvos de protozoários
id CRUZ_6efaed36af6a7b3cdc246021ed8617f6
oai_identifier_str oai:www.arca.fiocruz.br:icict/13624
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Kotowski Filho, Nelson PeixotoLellis, Renata SchamaSilva, Fabricio Alves Barbosa daCruz, Sérgio Manuel Serra daMoraes, Milton OzórioCavalcanti, Maria Claudia ReisRivera Davila, Alberto Martin2016-04-07T13:21:46Z2016-04-07T13:21:46Z2015KOTOWSKI FILHO, N. P. Genômica comparativa em ambiente computacional distribuído aplicabilidade e potencial no estudo de homologia entre protozoários. 2015. 198f. Tese (Doutorado em Biologia Computacional e Sistemas) - Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de janeiro, RJ, 2015.https://www.arca.fiocruz.br/handle/icict/13624A inferência de homologia entre organismos é uma atividade da genômica comparativa que possibilita compreender melhor a relação entre os mesmos e, por conseguinte, sua distância evolutiva. Especificamente, a identificação de genes ortólogos, ou seja, aqueles que têm sua origem em um ancestral comum, permite oferecer melhorias na anotação funcional de genes, uma vez que genes ortólogos tendem a ter sua função conservada. Com a crescente disponibilidade de genomas através de técnicas de NGS, a construção e atualização de bases de dados de ortólogos representam um desafio constante, pois demandam o estudo e identificação das relações entre os genes de tais organismos, em um volume de dados cada vez mais extenso e a um custo computacional cada vez mais elevado. Nesta tese propomos a solução para nuvem computacional elastic-OrthoSearch, um workflow científico de genômica comparativa inspirado no OrthoSearch, responsável pela inferência de homologia entre organismos com o uso de abordagem baseada em melhores hits recíprocos e perfis de Markov. Também propomos uma metodologia para criação de bases de ortólogos construída através do reuso do OrthoSearch. Esta metodologia mostrou-se capaz de alavancar a oferta de grupos ortólogos e assim auxiliar, por exemplo, na identificação de alvos de protozoáriosHomology inference among organisms is a comparative genomics tasks which allows for a better understanding on how such organisms are related to each other and on their evolutionary distance. Specifically, the identification of orthologous genes – those who share a common ancestor – allows for functional gene annotation improvements, as orthologous genes tend to preserve their functions. The increasing amount of genomic data provided by the NGS techniques makes the orthologous databases’ building and update processes a challenging task. It requires the identification and study of the organisms’ genes relationships, in an extensive data volume and at an increasing computational cost. In this thesis we propose elastic-OrthoSearch, a cloud-enabled comparative genomics scientific workflow, derived from OrthoSearch. It aims at providing homology inference among organisms, in a reciprocal best hits and Markov profiles approach. We also propose an improved orthologous database creation methodology built on top of OrthoSearch. Such methodology has shown means to offer a broader orthologous groups dataset, which could in turn aid on Protozoa target identification.Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, BrasilporGenômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoáriosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis2015-Out-28Pós-Graduação em Biologia Computacional e SistemasFundação Oswaldo Cruz. Instituto Oswaldo CruzRio de Janeiro/RJPrograma de Pós-Graduação em Biologia Computacional e SistemasHomologia de GenesGenômicaGenoma de ProtozoárioFluxo de Trabalhoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZORIGINALnelson_filho_ioc_dout_2015.pdfapplication/pdf18433990https://www.arca.fiocruz.br/bitstream/icict/13624/1/nelson_filho_ioc_dout_2015.pdf8dd6a2876cb547b6a2d7fe8493822e55MD51LICENSElicense.txttext/plain1748https://www.arca.fiocruz.br/bitstream/icict/13624/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTnelson_filho_ioc_dout_2015.pdf.txtnelson_filho_ioc_dout_2015.pdf.txtExtracted texttext/plain291752https://www.arca.fiocruz.br/bitstream/icict/13624/3/nelson_filho_ioc_dout_2015.pdf.txt4a1f654ddd45a2b34abd269f4053ea90MD53icict/136242022-06-24 12:19:33.755oai:www.arca.fiocruz.br:icict/13624Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352022-06-24T15:19:33Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)false
dc.title.pt_BR.fl_str_mv Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
title Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
spellingShingle Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
Kotowski Filho, Nelson Peixoto
Homologia de Genes
Genômica
Genoma de Protozoário
Fluxo de Trabalho
title_short Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
title_full Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
title_fullStr Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
title_full_unstemmed Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
title_sort Genômica comparativa em ambiente computacional distribuídoaplicabilidade e potencial no estudo de homologia entre protozoários
author Kotowski Filho, Nelson Peixoto
author_facet Kotowski Filho, Nelson Peixoto
author_role author
dc.contributor.member.pt_BR.fl_str_mv Lellis, Renata Schama
Silva, Fabricio Alves Barbosa da
Cruz, Sérgio Manuel Serra da
Moraes, Milton Ozório
Cavalcanti, Maria Claudia Reis
dc.contributor.author.fl_str_mv Kotowski Filho, Nelson Peixoto
dc.contributor.advisor1.fl_str_mv Rivera Davila, Alberto Martin
contributor_str_mv Rivera Davila, Alberto Martin
dc.subject.decs.pt_BR.fl_str_mv Homologia de Genes
Genômica
Genoma de Protozoário
Fluxo de Trabalho
topic Homologia de Genes
Genômica
Genoma de Protozoário
Fluxo de Trabalho
description A inferência de homologia entre organismos é uma atividade da genômica comparativa que possibilita compreender melhor a relação entre os mesmos e, por conseguinte, sua distância evolutiva. Especificamente, a identificação de genes ortólogos, ou seja, aqueles que têm sua origem em um ancestral comum, permite oferecer melhorias na anotação funcional de genes, uma vez que genes ortólogos tendem a ter sua função conservada. Com a crescente disponibilidade de genomas através de técnicas de NGS, a construção e atualização de bases de dados de ortólogos representam um desafio constante, pois demandam o estudo e identificação das relações entre os genes de tais organismos, em um volume de dados cada vez mais extenso e a um custo computacional cada vez mais elevado. Nesta tese propomos a solução para nuvem computacional elastic-OrthoSearch, um workflow científico de genômica comparativa inspirado no OrthoSearch, responsável pela inferência de homologia entre organismos com o uso de abordagem baseada em melhores hits recíprocos e perfis de Markov. Também propomos uma metodologia para criação de bases de ortólogos construída através do reuso do OrthoSearch. Esta metodologia mostrou-se capaz de alavancar a oferta de grupos ortólogos e assim auxiliar, por exemplo, na identificação de alvos de protozoários
publishDate 2015
dc.date.issued.fl_str_mv 2015
dc.date.accessioned.fl_str_mv 2016-04-07T13:21:46Z
dc.date.available.fl_str_mv 2016-04-07T13:21:46Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv KOTOWSKI FILHO, N. P. Genômica comparativa em ambiente computacional distribuído aplicabilidade e potencial no estudo de homologia entre protozoários. 2015. 198f. Tese (Doutorado em Biologia Computacional e Sistemas) - Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de janeiro, RJ, 2015.
dc.identifier.uri.fl_str_mv https://www.arca.fiocruz.br/handle/icict/13624
identifier_str_mv KOTOWSKI FILHO, N. P. Genômica comparativa em ambiente computacional distribuído aplicabilidade e potencial no estudo de homologia entre protozoários. 2015. 198f. Tese (Doutorado em Biologia Computacional e Sistemas) - Fundação Oswaldo Cruz, Instituto Oswaldo Cruz, Rio de janeiro, RJ, 2015.
url https://www.arca.fiocruz.br/handle/icict/13624
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://www.arca.fiocruz.br/bitstream/icict/13624/1/nelson_filho_ioc_dout_2015.pdf
https://www.arca.fiocruz.br/bitstream/icict/13624/2/license.txt
https://www.arca.fiocruz.br/bitstream/icict/13624/3/nelson_filho_ioc_dout_2015.pdf.txt
bitstream.checksum.fl_str_mv 8dd6a2876cb547b6a2d7fe8493822e55
8a4605be74aa9ea9d79846c1fba20a33
4a1f654ddd45a2b34abd269f4053ea90
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1813009225243164672