Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/BUOS-B7UN89 |
Resumo: | A origem dos genes sempre fascinou os cientistas, e a lista de mecanismos propostos para a origem de novos genes tem aumentado. A exploração desses mecanismos se beneficiaria muito da descrição de um cenário de aparecimento dos genes ao longo da evolução. Este trabalho cria ferramentas para descrição desse cenário e estima o surgimento de genes em larga escala, não dentro do tempo cronológico, mas em um contexto cladístico. As ferramentas produzidas e disponibilizadas online podem ser agrupadas em três produtos:(i) o conjunto de ferramentas e serviços BioTools Service, (ii) o website Genesis e (iii) a plataforma de Web services BOWS. BioTools Service é um suíte de scripts direcionados para processar dados de taxonomia e para inferência da origem gênica e é composto por quatrosubprodutos: TaxSimple, GetAllChildren, LCA e GeneOriginUEKO. TaxSimple planifica a os dados taxonômicos hierárquicos do NCBI com o intuito de facilitar as consultas taxonômicas. GetAllChildren é um serviço que retorna todos os nodos-folha da árvore da vidaque são descendentes de um clado. LCA (Lowest Common Ancestor) é um script que retorna o ancestral comum de dois ou mais nodos. GeneOriginUEKO é capaz de inferir a origem de genes a partir de grupos de ortólogos da base UEKO (versão enriquecida da base KEGGORTHOLOGY). Gráficos gerados com base nos resultados mostram um padrão ondulatório de emergência de genes humanos com picos em certos clados, como Euteleostomi e Eutheria. Verificou-se também que as vias metabólicas humanas vão ganhando elementos ao longo daevolução, como observado na via de sinalização JAK-STAT. Porém, foi constatado que eventos de transferência horizontal poderiam levar o LCA erroneamente em direção à raiz da árvore da vida. Para contornar essa questão, foi desenvolvido o algoritmo de LCA Múltiplo, o qual utiliza genomas completos para isolar as transferências horizontais e, assim, inferir múltiplas origens de um gene. O website Genesis, construído com base nesse algoritmo, provê interface gráfica para os principais resultados das análises de origem múltipla e também permite a realização de análises com dados customizados. Finalmente, foi criada a plataforma BOWS, um sistema que centraliza e provê acesso universal e seguro a ferramentas de bioinformática instaladas em clusters computacionais remotos. BOWS pode ser instalado em qualquer laboratório e já vem sendo usado com sucesso no Laboratório de Biodados da UFMG |
id |
UFMG_2f492e49df766a7a1ac9e604ac114344 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/BUOS-B7UN89 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Jose Miguel OrtegaHenrique Velloso Ferreira Melo2019-08-14T10:28:15Z2019-08-14T10:28:15Z2014-07-31http://hdl.handle.net/1843/BUOS-B7UN89A origem dos genes sempre fascinou os cientistas, e a lista de mecanismos propostos para a origem de novos genes tem aumentado. A exploração desses mecanismos se beneficiaria muito da descrição de um cenário de aparecimento dos genes ao longo da evolução. Este trabalho cria ferramentas para descrição desse cenário e estima o surgimento de genes em larga escala, não dentro do tempo cronológico, mas em um contexto cladístico. As ferramentas produzidas e disponibilizadas online podem ser agrupadas em três produtos:(i) o conjunto de ferramentas e serviços BioTools Service, (ii) o website Genesis e (iii) a plataforma de Web services BOWS. BioTools Service é um suíte de scripts direcionados para processar dados de taxonomia e para inferência da origem gênica e é composto por quatrosubprodutos: TaxSimple, GetAllChildren, LCA e GeneOriginUEKO. TaxSimple planifica a os dados taxonômicos hierárquicos do NCBI com o intuito de facilitar as consultas taxonômicas. GetAllChildren é um serviço que retorna todos os nodos-folha da árvore da vidaque são descendentes de um clado. LCA (Lowest Common Ancestor) é um script que retorna o ancestral comum de dois ou mais nodos. GeneOriginUEKO é capaz de inferir a origem de genes a partir de grupos de ortólogos da base UEKO (versão enriquecida da base KEGGORTHOLOGY). Gráficos gerados com base nos resultados mostram um padrão ondulatório de emergência de genes humanos com picos em certos clados, como Euteleostomi e Eutheria. Verificou-se também que as vias metabólicas humanas vão ganhando elementos ao longo daevolução, como observado na via de sinalização JAK-STAT. Porém, foi constatado que eventos de transferência horizontal poderiam levar o LCA erroneamente em direção à raiz da árvore da vida. Para contornar essa questão, foi desenvolvido o algoritmo de LCA Múltiplo, o qual utiliza genomas completos para isolar as transferências horizontais e, assim, inferir múltiplas origens de um gene. O website Genesis, construído com base nesse algoritmo, provê interface gráfica para os principais resultados das análises de origem múltipla e também permite a realização de análises com dados customizados. Finalmente, foi criada a plataforma BOWS, um sistema que centraliza e provê acesso universal e seguro a ferramentas de bioinformática instaladas em clusters computacionais remotos. BOWS pode ser instalado em qualquer laboratório e já vem sendo usado com sucesso no Laboratório de Biodados da UFMGThe origins of genes have always fascinated scientists, and the list of proposed mechanisms for the origin of new genes has progressively increased. The exploitation of such mechanisms would greatly benefit from a description of the scenario underlying the rise of genes throughout evolution. This work creates tools for the description of this scenario andassesses the emergence of genes on large scale, not in chronological time, but in a cladistic context. The generated tools, all available online, can be grouped into three products: (i) a set of tools and services named BioTools Service (ii) the Genesis website and (iii) a Web services platform called BOWS. BioTools Service is a suite of scripts and services targeted to process taxonomy data and infer the origin of genes. It consists of four byproducts: TaxSimple, GetAllChildren, LCA and GeneOriginUEKO. TaxSimple flattens the hierarchical taxonomicdata from NCBI in order to facilitate taxonomic queries. GetAllChildren is a Web service that returns all leaf nodes descendants of a given clade in the tree of life. LCA (Lowest Common Ancestor) is a script that returns the common ancestor of two or more given nodes. GeneOriginUEKO can infer the origin of genes using UEKO clusters of orthologous (anenriched version of the KEGG ORTHOLOGY database). Graphs generated based on the results show wave patterns of human gene emergence with peaks in certain clades, such as Euteleostomi and Eutheria. It was also observed that some human metabolic pathways were increasingly gaining elements throughout evolution, as seen for the JAK-STAT signaling pathway. However, it was found that horizontal transfer events could cause the LCA to incorrectly move toward the root of the tree of life. To work around this issue, the multiple LCA was developed, which isolates horizontal transfers with the aid of complete genomes and thereby infer multiple origins of a gene. The Genesis website, built based on this algorithm, provides a graphical interface to the main results of the gene multiple origins analysis and also permits performing of analyses with custom input data. At least this work presents the BOWS platform, a system that centralizes and provides universal and secure access to bioinformatics tools installed on remote computational clusters. BOWS can be installed in any lab and is already being used successfully in Biodados Lab at UFMGUniversidade Federal de Minas GeraisUFMGGenesBioinformáticaBioinformaticaFerramentas e serviços online para a análise da origem cladística de genes e vias metabólicasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtese_velloso_final.pdfapplication/pdf5520705https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/1/tese_velloso_final.pdf8f2b9297f720d47907b4ddcbc36f707aMD51TEXTtese_velloso_final.pdf.txttese_velloso_final.pdf.txtExtracted texttext/plain249375https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/2/tese_velloso_final.pdf.txtdbfc1e6cb8b1b7afeabf10fd86758fa8MD521843/BUOS-B7UN892019-11-14 13:31:01.768oai:repositorio.ufmg.br:1843/BUOS-B7UN89Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T16:31:01Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas |
title |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas |
spellingShingle |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas Henrique Velloso Ferreira Melo Bioinformatica Genes Bioinformática |
title_short |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas |
title_full |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas |
title_fullStr |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas |
title_full_unstemmed |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas |
title_sort |
Ferramentas e serviços online para a análise da origem cladística de genes e vias metabólicas |
author |
Henrique Velloso Ferreira Melo |
author_facet |
Henrique Velloso Ferreira Melo |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Jose Miguel Ortega |
dc.contributor.author.fl_str_mv |
Henrique Velloso Ferreira Melo |
contributor_str_mv |
Jose Miguel Ortega |
dc.subject.por.fl_str_mv |
Bioinformatica |
topic |
Bioinformatica Genes Bioinformática |
dc.subject.other.pt_BR.fl_str_mv |
Genes Bioinformática |
description |
A origem dos genes sempre fascinou os cientistas, e a lista de mecanismos propostos para a origem de novos genes tem aumentado. A exploração desses mecanismos se beneficiaria muito da descrição de um cenário de aparecimento dos genes ao longo da evolução. Este trabalho cria ferramentas para descrição desse cenário e estima o surgimento de genes em larga escala, não dentro do tempo cronológico, mas em um contexto cladístico. As ferramentas produzidas e disponibilizadas online podem ser agrupadas em três produtos:(i) o conjunto de ferramentas e serviços BioTools Service, (ii) o website Genesis e (iii) a plataforma de Web services BOWS. BioTools Service é um suíte de scripts direcionados para processar dados de taxonomia e para inferência da origem gênica e é composto por quatrosubprodutos: TaxSimple, GetAllChildren, LCA e GeneOriginUEKO. TaxSimple planifica a os dados taxonômicos hierárquicos do NCBI com o intuito de facilitar as consultas taxonômicas. GetAllChildren é um serviço que retorna todos os nodos-folha da árvore da vidaque são descendentes de um clado. LCA (Lowest Common Ancestor) é um script que retorna o ancestral comum de dois ou mais nodos. GeneOriginUEKO é capaz de inferir a origem de genes a partir de grupos de ortólogos da base UEKO (versão enriquecida da base KEGGORTHOLOGY). Gráficos gerados com base nos resultados mostram um padrão ondulatório de emergência de genes humanos com picos em certos clados, como Euteleostomi e Eutheria. Verificou-se também que as vias metabólicas humanas vão ganhando elementos ao longo daevolução, como observado na via de sinalização JAK-STAT. Porém, foi constatado que eventos de transferência horizontal poderiam levar o LCA erroneamente em direção à raiz da árvore da vida. Para contornar essa questão, foi desenvolvido o algoritmo de LCA Múltiplo, o qual utiliza genomas completos para isolar as transferências horizontais e, assim, inferir múltiplas origens de um gene. O website Genesis, construído com base nesse algoritmo, provê interface gráfica para os principais resultados das análises de origem múltipla e também permite a realização de análises com dados customizados. Finalmente, foi criada a plataforma BOWS, um sistema que centraliza e provê acesso universal e seguro a ferramentas de bioinformática instaladas em clusters computacionais remotos. BOWS pode ser instalado em qualquer laboratório e já vem sendo usado com sucesso no Laboratório de Biodados da UFMG |
publishDate |
2014 |
dc.date.issued.fl_str_mv |
2014-07-31 |
dc.date.accessioned.fl_str_mv |
2019-08-14T10:28:15Z |
dc.date.available.fl_str_mv |
2019-08-14T10:28:15Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/BUOS-B7UN89 |
url |
http://hdl.handle.net/1843/BUOS-B7UN89 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/1/tese_velloso_final.pdf https://repositorio.ufmg.br/bitstream/1843/BUOS-B7UN89/2/tese_velloso_final.pdf.txt |
bitstream.checksum.fl_str_mv |
8f2b9297f720d47907b4ddcbc36f707a dbfc1e6cb8b1b7afeabf10fd86758fa8 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589473008615424 |