Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional

Detalhes bibliográficos
Autor(a) principal: Rafael Lucas Muniz Guedes
Data de Publicação: 2013
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/BUOS-9BNJT2
Resumo: Com o avanço das tecnologias de seqüenciamento, a organização das bases de dados secundárias é uma contribuição importante, nas quais o conhecimento existente é organizado com base em informações biológicas. Agrupamento de genes homólogos e a atribuição de termos de ontologia funcional envolvendo genes já conhecidos sãoformas de acelerar a análise de dados de novos seqüenciamentos. Neste trabalho relatamos o desenvolvimento do SeedServer, U-MAGE e aplicações. A integração de bancos de dados e programa agrupador de proteínas homólogas capazes de incluir seqüências provenientes de genomas incompletos, conjuntamente com metodologias de validação e comparação de estruturas secundárias resultou no desenvolvimento da ferramenta SeedServer. Grupos de homólogos criados a partir de seqüências de interesse do usuário são gerados com auxílio de uma interface web onde também é possível descarregar as seqüências agrupadas, obter relatórios com taxonomia completa e estimar a origem do gene em questão através da determinação do ancestral comum mais recente. O programa SeedServer, após ser testado e avaliado foi então utilizado em um estudo da heterotrofia de aminoácidos através da formação de grupos de homólogos das enzimas presentes nas vias biossintéticas de aminoácidos essenciais, demonstrando um quadro denominado de Grande Deleção Genômica em diferentes grupos de eucariotos e procariotos. A esse evento pode se suceder a perda da capacidade de assimilação de nitrogênio, componente essencial na formação dos aminoácidos. Estudos filogenéticos mostraram uma maior taxa de mutação dentre as enzimas remanescentes de vias incompletas quando comparadas com outras de vias completas. Adicionalmente, para melhorar a qualidade da anotação funcional de seqüências protéicas, foi criada a ferramenta denominada UMAGE (UniRef50 Matrices for Annotation of Gene Ontology Entries) que utiliza como base de propagação de termos de ontologia funcional, matrizes de recobrimento entre seqüências de mesmo UniRef50. O U-MAGE demonstrou uma melhora qualitativa significativa na anotação de ontologia funcional de diversos organismos. As duas ferramentas SeedServer e U-MAGE contribuem para a aceleração da propagação de informação de proteínas conhecidas, um desafio atual imposto à Bioinformática para fazer frente à intensa produção de novas seqüências
id UFMG_6c4cd2bd22a664988752702bef74a21c
oai_identifier_str oai:repositorio.ufmg.br:1843/BUOS-9BNJT2
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Jose Miguel OrtegaRafael Lucas Muniz Guedes2019-08-14T15:22:13Z2019-08-14T15:22:13Z2013-04-30http://hdl.handle.net/1843/BUOS-9BNJT2Com o avanço das tecnologias de seqüenciamento, a organização das bases de dados secundárias é uma contribuição importante, nas quais o conhecimento existente é organizado com base em informações biológicas. Agrupamento de genes homólogos e a atribuição de termos de ontologia funcional envolvendo genes já conhecidos sãoformas de acelerar a análise de dados de novos seqüenciamentos. Neste trabalho relatamos o desenvolvimento do SeedServer, U-MAGE e aplicações. A integração de bancos de dados e programa agrupador de proteínas homólogas capazes de incluir seqüências provenientes de genomas incompletos, conjuntamente com metodologias de validação e comparação de estruturas secundárias resultou no desenvolvimento da ferramenta SeedServer. Grupos de homólogos criados a partir de seqüências de interesse do usuário são gerados com auxílio de uma interface web onde também é possível descarregar as seqüências agrupadas, obter relatórios com taxonomia completa e estimar a origem do gene em questão através da determinação do ancestral comum mais recente. O programa SeedServer, após ser testado e avaliado foi então utilizado em um estudo da heterotrofia de aminoácidos através da formação de grupos de homólogos das enzimas presentes nas vias biossintéticas de aminoácidos essenciais, demonstrando um quadro denominado de Grande Deleção Genômica em diferentes grupos de eucariotos e procariotos. A esse evento pode se suceder a perda da capacidade de assimilação de nitrogênio, componente essencial na formação dos aminoácidos. Estudos filogenéticos mostraram uma maior taxa de mutação dentre as enzimas remanescentes de vias incompletas quando comparadas com outras de vias completas. Adicionalmente, para melhorar a qualidade da anotação funcional de seqüências protéicas, foi criada a ferramenta denominada UMAGE (UniRef50 Matrices for Annotation of Gene Ontology Entries) que utiliza como base de propagação de termos de ontologia funcional, matrizes de recobrimento entre seqüências de mesmo UniRef50. O U-MAGE demonstrou uma melhora qualitativa significativa na anotação de ontologia funcional de diversos organismos. As duas ferramentas SeedServer e U-MAGE contribuem para a aceleração da propagação de informação de proteínas conhecidas, um desafio atual imposto à Bioinformática para fazer frente à intensa produção de novas seqüênciasWith advances in sequencing technologies, an important contribution is the organization of secondary databases, where existing knowledge is organized based on biological information. Grouping of homologous genes and assigning terms of functional ontology involving already known genes are ways to speed the analysis of data from new sequencing. We report the development of SeedServer, U-MAGE and applications. The integration of databases and a program capable of clustering homologous proteins including sequences derived from incomplete genomes, together with validation methods and comparison of secondary structures resulted in the development of SeedServer tool. Groups of homologous sequences chosen from user interest are generated with the aid of a web interface where you can also download the grouped sequences, get taxonomy reports and estimate the origin of the gene in question by determining the lowest common ancestor. The program SeedServer after being tested and evaluated was then used in a study of amino acid heterotrophy by forming groups of homologous enzymes present in the essential amino acids biosynthetic pathways, showing a scenario called the Great Genomic Deletion in different groups of eukaryotes and prokaryotes. Following that event may be the loss of assimilative capacity of nitrogen, an essential component in the formation of amino acids. Phylogenetic studies showed a higher rate of mutation among the enzymes remaining in incomplete pathways when compared with others from complete pathways. Additionally, to improve the quality of functional annotation of protein sequences, we created the tool called U-MAGE (UniRef50 Matrices for Annotation of Gene Ontology Entries) that uses as the basis of propagation of functional ontology terms the coverage between sequences within a UniRef50 organized in matrices. The U-MAGE demonstrated a significant qualitative improvement in functional ontology annotation of various organisms. Both tools SeedServer and U-MAGE contribute to the acceleration of the information spread from known proteins, a challenge to the current Bioinformatics to face the intense production of new sequencesUniversidade Federal de Minas GeraisUFMGOntologiasBioinformáticaProteínas Banco de dadosProteínas homólogasAlinhamento de seqüências (Bioinformática)BioinformáticaDesenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcionalinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALteserafaelguedes.pdfapplication/pdf5195773https://repositorio.ufmg.br/bitstream/1843/BUOS-9BNJT2/1/teserafaelguedes.pdfa137ad32a51dab7a00f9f241da67a7b7MD51TEXTteserafaelguedes.pdf.txtteserafaelguedes.pdf.txtExtracted texttext/plain245686https://repositorio.ufmg.br/bitstream/1843/BUOS-9BNJT2/2/teserafaelguedes.pdf.txtffade53debea424c4db31f5985d4ef07MD521843/BUOS-9BNJT22019-11-14 13:48:08.707oai:repositorio.ufmg.br:1843/BUOS-9BNJT2Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T16:48:08Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
title Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
spellingShingle Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
Rafael Lucas Muniz Guedes
Bioinformática
Ontologias
Bioinformática
Proteínas Banco de dados
Proteínas homólogas
Alinhamento de seqüências (Bioinformática)
title_short Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
title_full Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
title_fullStr Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
title_full_unstemmed Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
title_sort Desenvolvimento das ferramentas SeedServer, para agrupamento de seqüências protéicas homólogas e U-MAGE, para propagação de ontologia funcional
author Rafael Lucas Muniz Guedes
author_facet Rafael Lucas Muniz Guedes
author_role author
dc.contributor.advisor1.fl_str_mv Jose Miguel Ortega
dc.contributor.author.fl_str_mv Rafael Lucas Muniz Guedes
contributor_str_mv Jose Miguel Ortega
dc.subject.por.fl_str_mv Bioinformática
topic Bioinformática
Ontologias
Bioinformática
Proteínas Banco de dados
Proteínas homólogas
Alinhamento de seqüências (Bioinformática)
dc.subject.other.pt_BR.fl_str_mv Ontologias
Bioinformática
Proteínas Banco de dados
Proteínas homólogas
Alinhamento de seqüências (Bioinformática)
description Com o avanço das tecnologias de seqüenciamento, a organização das bases de dados secundárias é uma contribuição importante, nas quais o conhecimento existente é organizado com base em informações biológicas. Agrupamento de genes homólogos e a atribuição de termos de ontologia funcional envolvendo genes já conhecidos sãoformas de acelerar a análise de dados de novos seqüenciamentos. Neste trabalho relatamos o desenvolvimento do SeedServer, U-MAGE e aplicações. A integração de bancos de dados e programa agrupador de proteínas homólogas capazes de incluir seqüências provenientes de genomas incompletos, conjuntamente com metodologias de validação e comparação de estruturas secundárias resultou no desenvolvimento da ferramenta SeedServer. Grupos de homólogos criados a partir de seqüências de interesse do usuário são gerados com auxílio de uma interface web onde também é possível descarregar as seqüências agrupadas, obter relatórios com taxonomia completa e estimar a origem do gene em questão através da determinação do ancestral comum mais recente. O programa SeedServer, após ser testado e avaliado foi então utilizado em um estudo da heterotrofia de aminoácidos através da formação de grupos de homólogos das enzimas presentes nas vias biossintéticas de aminoácidos essenciais, demonstrando um quadro denominado de Grande Deleção Genômica em diferentes grupos de eucariotos e procariotos. A esse evento pode se suceder a perda da capacidade de assimilação de nitrogênio, componente essencial na formação dos aminoácidos. Estudos filogenéticos mostraram uma maior taxa de mutação dentre as enzimas remanescentes de vias incompletas quando comparadas com outras de vias completas. Adicionalmente, para melhorar a qualidade da anotação funcional de seqüências protéicas, foi criada a ferramenta denominada UMAGE (UniRef50 Matrices for Annotation of Gene Ontology Entries) que utiliza como base de propagação de termos de ontologia funcional, matrizes de recobrimento entre seqüências de mesmo UniRef50. O U-MAGE demonstrou uma melhora qualitativa significativa na anotação de ontologia funcional de diversos organismos. As duas ferramentas SeedServer e U-MAGE contribuem para a aceleração da propagação de informação de proteínas conhecidas, um desafio atual imposto à Bioinformática para fazer frente à intensa produção de novas seqüências
publishDate 2013
dc.date.issued.fl_str_mv 2013-04-30
dc.date.accessioned.fl_str_mv 2019-08-14T15:22:13Z
dc.date.available.fl_str_mv 2019-08-14T15:22:13Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUOS-9BNJT2
url http://hdl.handle.net/1843/BUOS-9BNJT2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/BUOS-9BNJT2/1/teserafaelguedes.pdf
https://repositorio.ufmg.br/bitstream/1843/BUOS-9BNJT2/2/teserafaelguedes.pdf.txt
bitstream.checksum.fl_str_mv a137ad32a51dab7a00f9f241da67a7b7
ffade53debea424c4db31f5985d4ef07
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801676793779847168