Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas

Detalhes bibliográficos
Autor(a) principal: Henrique Velloso Ferreira Melo
Data de Publicação: 2014
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/BUOS-B7UN89
Resumo: A origem dos genes sempre fascinou os cientistas, e a lista de mecanismos propostos para a origem de novos genes tem aumentado. A exploração desses mecanismos se beneficiaria muito da descrição de um cenário de aparecimento dos genes ao longo da evolução. Este trabalho cria ferramentas para descrição desse cenário e estima o surgimento de genes em larga escala, não dentro do tempo cronológico, mas em um contexto cladístico. As ferramentas produzidas e disponibilizadas online podem ser agrupadas em três produtos:(i) o conjunto de ferramentas e serviços BioTools Service, (ii) o website Genesis e (iii) a plataforma de Web services BOWS. BioTools Service é um suíte de scripts direcionados para processar dados de taxonomia e para inferência da origem gênica e é composto por quatrosubprodutos: TaxSimple, GetAllChildren, LCA e GeneOriginUEKO. TaxSimple planifica a os dados taxonômicos hierárquicos do NCBI com o intuito de facilitar as consultas taxonômicas. GetAllChildren é um serviço que retorna todos os nodos-folha da árvore da vidaque são descendentes de um clado. LCA (Lowest Common Ancestor) é um script que retorna o ancestral comum de dois ou mais nodos. GeneOriginUEKO é capaz de inferir a origem de genes a partir de grupos de ortólogos da base UEKO (versão enriquecida da base KEGGORTHOLOGY). Gráficos gerados com base nos resultados mostram um padrão ondulatório de emergência de genes humanos com picos em certos clados, como Euteleostomi e Eutheria. Verificou-se também que as vias metabólicas humanas vão ganhando elementos ao longo daevolução, como observado na via de sinalização JAK-STAT. Porém, foi constatado que eventos de transferência horizontal poderiam levar o LCA erroneamente em direção à raiz da árvore da vida. Para contornar essa questão, foi desenvolvido o algoritmo de LCA Múltiplo, o qual utiliza genomas completos para isolar as transferências horizontais e, assim, inferir múltiplas origens de um gene. O website Genesis, construído com base nesse algoritmo, provê interface gráfica para os principais resultados das análises de origem múltipla e também permite a realização de análises com dados customizados. Finalmente, foi criada a plataforma BOWS, um sistema que centraliza e provê acesso universal e seguro a ferramentas de bioinformática instaladas em clusters computacionais remotos. BOWS pode ser instalado em qualquer laboratório e já vem sendo usado com sucesso no Laboratório de Biodados da UFMG
id UFMG_2f492e49df766a7a1ac9e604ac114344
oai_identifier_str oai:repositorio.ufmg.br:1843/BUOS-B7UN89
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Jose Miguel OrtegaHenrique Velloso Ferreira Melo2019-08-14T10:28:15Z2019-08-14T10:28:15Z2014-07-31http://hdl.handle.net/1843/BUOS-B7UN89A origem dos genes sempre fascinou os cientistas, e a lista de mecanismos propostos para a origem de novos genes tem aumentado. A exploração desses mecanismos se beneficiaria muito da descrição de um cenário de aparecimento dos genes ao longo da evolução. Este trabalho cria ferramentas para descrição desse cenário e estima o surgimento de genes em larga escala, não dentro do tempo cronológico, mas em um contexto cladístico. As ferramentas produzidas e disponibilizadas online podem ser agrupadas em três produtos:(i) o conjunto de ferramentas e serviços BioTools Service, (ii) o website Genesis e (iii) a plataforma de Web services BOWS. BioTools Service é um suíte de scripts direcionados para processar dados de taxonomia e para inferência da origem gênica e é composto por quatrosubprodutos: TaxSimple, GetAllChildren, LCA e GeneOriginUEKO. TaxSimple planifica a os dados taxonômicos hierárquicos do NCBI com o intuito de facilitar as consultas taxonômicas. GetAllChildren é um serviço que retorna todos os nodos-folha da árvore da vidaque são descendentes de um clado. LCA (Lowest Common Ancestor) é um script que retorna o ancestral comum de dois ou mais nodos. GeneOriginUEKO é capaz de inferir a origem de genes a partir de grupos de ortólogos da base UEKO (versão enriquecida da base KEGGORTHOLOGY). Gráficos gerados com base nos resultados mostram um padrão ondulatório de emergência de genes humanos com picos em certos clados, como Euteleostomi e Eutheria. Verificou-se também que as vias metabólicas humanas vão ganhando elementos ao longo daevolução, como observado na via de sinalização JAK-STAT. Porém, foi constatado que eventos de transferência horizontal poderiam levar o LCA erroneamente em direção à raiz da árvore da vida. Para contornar essa questão, foi desenvolvido o algoritmo de LCA Múltiplo, o qual utiliza genomas completos para isolar as transferências horizontais e, assim, inferir múltiplas origens de um gene. O website Genesis, construído com base nesse algoritmo, provê interface gráfica para os principais resultados das análises de origem múltipla e também permite a realização de análises com dados customizados. Finalmente, foi criada a plataforma BOWS, um sistema que centraliza e provê acesso universal e seguro a ferramentas de bioinformática instaladas em clusters computacionais remotos. BOWS pode ser instalado em qualquer laboratório e já vem sendo usado com sucesso no Laboratório de Biodados da UFMGThe origins of genes have always fascinated scientists, and the list of proposed mechanisms for the origin of new genes has progressively increased. The exploitation of such mechanisms would greatly benefit from a description of the scenario underlying the rise of genes throughout evolution. This work creates tools for the description of this scenario andassesses the emergence of genes on large scale, not in chronological time, but in a cladistic context. The generated tools, all available online, can be grouped into three products: (i) a set of tools and services named BioTools Service (ii) the Genesis website and (iii) a Web services platform called BOWS. BioTools Service is a suite of scripts and services targeted to process taxonomy data and infer the origin of genes. It consists of four byproducts: TaxSimple, GetAllChildren, LCA and GeneOriginUEKO. TaxSimple flattens the hierarchical taxonomicdata from NCBI in order to facilitate taxonomic queries. GetAllChildren is a Web service that returns all leaf nodes descendants of a given clade in the tree of life. LCA (Lowest Common Ancestor) is a script that returns the common ancestor of two or more given nodes. GeneOriginUEKO can infer the origin of genes using UEKO clusters of orthologous (anenriched version of the KEGG ORTHOLOGY database). Graphs generated based on the results show wave patterns of human gene emergence with peaks in certain clades, such as Euteleostomi and Eutheria. It was also observed that some human metabolic pathways were increasingly gaining elements throughout evolution, as seen for the JAK-STAT signaling pathway. However, it was found that horizontal transfer events could cause the LCA to incorrectly move toward the root of the tree of life. To work around this issue, the multiple LCA was developed, which isolates horizontal transfers with the aid of complete genomes and thereby infer multiple origins of a gene. The Genesis website, built based on this algorithm, provides a graphical interface to the main results of the gene multiple origins analysis and also permits performing of analyses with custom input data. At least this work presents the BOWS platform, a system that centralizes and provides universal and secure access to bioinformatics tools installed on remote computational clusters. BOWS can be installed in any lab and is already being used successfully in Biodados Lab at UFMGUniversidade Federal de Minas GeraisUFMGGenesBioinformáticaBioinformaticaFerramentas e serviços online para a análise da origem cladística de genes e vias metabólicasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_velloso_final.pdfapplication/pdf5520705https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/1/tese_velloso_final.pdf8f2b9297f720d47907b4ddcbc36f707aMD51TEXTtese_velloso_final.pdf.txttese_velloso_final.pdf.txtExtracted texttext/plain249375https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/2/tese_velloso_final.pdf.txtdbfc1e6cb8b1b7afeabf10fd86758fa8MD521843/BUOS-B7UN892019-11-14 13:31:01.768oai:repositorio.ufmg.br:1843/BUOS-B7UN89Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T16:31:01Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
title Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
spellingShingle Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
Henrique Velloso Ferreira Melo
Bioinformatica
Genes
Bioinformática
title_short Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
title_full Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
title_fullStr Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
title_full_unstemmed Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
title_sort Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
author Henrique Velloso Ferreira Melo
author_facet Henrique Velloso Ferreira Melo
author_role author
dc.contributor.advisor1.fl_str_mv Jose Miguel Ortega
dc.contributor.author.fl_str_mv Henrique Velloso Ferreira Melo
contributor_str_mv Jose Miguel Ortega
dc.subject.por.fl_str_mv Bioinformatica
topic Bioinformatica
Genes
Bioinformática
dc.subject.other.pt_BR.fl_str_mv Genes
Bioinformática
description A origem dos genes sempre fascinou os cientistas, e a lista de mecanismos propostos para a origem de novos genes tem aumentado. A exploração desses mecanismos se beneficiaria muito da descrição de um cenário de aparecimento dos genes ao longo da evolução. Este trabalho cria ferramentas para descrição desse cenário e estima o surgimento de genes em larga escala, não dentro do tempo cronológico, mas em um contexto cladístico. As ferramentas produzidas e disponibilizadas online podem ser agrupadas em três produtos:(i) o conjunto de ferramentas e serviços BioTools Service, (ii) o website Genesis e (iii) a plataforma de Web services BOWS. BioTools Service é um suíte de scripts direcionados para processar dados de taxonomia e para inferência da origem gênica e é composto por quatrosubprodutos: TaxSimple, GetAllChildren, LCA e GeneOriginUEKO. TaxSimple planifica a os dados taxonômicos hierárquicos do NCBI com o intuito de facilitar as consultas taxonômicas. GetAllChildren é um serviço que retorna todos os nodos-folha da árvore da vidaque são descendentes de um clado. LCA (Lowest Common Ancestor) é um script que retorna o ancestral comum de dois ou mais nodos. GeneOriginUEKO é capaz de inferir a origem de genes a partir de grupos de ortólogos da base UEKO (versão enriquecida da base KEGGORTHOLOGY). Gráficos gerados com base nos resultados mostram um padrão ondulatório de emergência de genes humanos com picos em certos clados, como Euteleostomi e Eutheria. Verificou-se também que as vias metabólicas humanas vão ganhando elementos ao longo daevolução, como observado na via de sinalização JAK-STAT. Porém, foi constatado que eventos de transferência horizontal poderiam levar o LCA erroneamente em direção à raiz da árvore da vida. Para contornar essa questão, foi desenvolvido o algoritmo de LCA Múltiplo, o qual utiliza genomas completos para isolar as transferências horizontais e, assim, inferir múltiplas origens de um gene. O website Genesis, construído com base nesse algoritmo, provê interface gráfica para os principais resultados das análises de origem múltipla e também permite a realização de análises com dados customizados. Finalmente, foi criada a plataforma BOWS, um sistema que centraliza e provê acesso universal e seguro a ferramentas de bioinformática instaladas em clusters computacionais remotos. BOWS pode ser instalado em qualquer laboratório e já vem sendo usado com sucesso no Laboratório de Biodados da UFMG
publishDate 2014
dc.date.issued.fl_str_mv 2014-07-31
dc.date.accessioned.fl_str_mv 2019-08-14T10:28:15Z
dc.date.available.fl_str_mv 2019-08-14T10:28:15Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUOS-B7UN89
url http://hdl.handle.net/1843/BUOS-B7UN89
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/1/tese_velloso_final.pdf
https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/2/tese_velloso_final.pdf.txt
bitstream.checksum.fl_str_mv 8f2b9297f720d47907b4ddcbc36f707a
dbfc1e6cb8b1b7afeabf10fd86758fa8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589473008615424