Predição de genes ab initio combinada com informações de alinhamento

Detalhes bibliográficos
Autor(a) principal: Bruno Tenório da Silveira Lopes
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/D.45.2019.tde-28092019-175959
Resumo: Na Bioinformática, o campo de pesquisa de predição computacional de genes codificadores de proteínas é um dos mais desafiadores e não sofreu muitos avanços na última década. Há basicamente dois grupos de métodos para predição de genes: métodos ab initio e métodos extrínsecos. O grupo ab initio ou intrínseco reúne os programas que realizam a predição apenas utilizando como entrada a sequência alvo. Esse grupo foca na busca por estruturas gênicas baseadas em sinais biológicos e trechos conservados. O outro grupo, chamado de extrínseco, reúne os programas que necessitam de outras sequências (de referência), além da sequência alvo para realizar a predição por meio do alinhamento da sequência alvo contra sequências de referência. Há também abordagens de predição, chamadas de híbridas, que tentam unir os dois métodos de predição incorporando alinhamentos para aumentar a precisão dos preditores ab initio. Nesse trabalho desenvolvemos uma extensão do arcabouço probabilístico ToPS para implementar duas técnicas de abordagens híbridas de predição e avaliar seus benefícios e méritos relativos. Os resultados obtidos mostram um claro benefício da inclusão de alinhamentos de genomas na predição, e prós e contras da inclusão de mapeamentos de transcritos. Além disso, construímos um modelo genérico para incluir num preditor de genes informações probabilísticas externas. Esse modelo é implementado no ToPS e pode ser usado para desenvolver mais estratégias de predição de genes.
id USP_f76a4724fdfab42f6d78bbce82b783bd
oai_identifier_str oai:teses.usp.br:tde-28092019-175959
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis Predição de genes ab initio combinada com informações de alinhamento Ab initio gene prediction combined with alignment information 2019-04-22Alan Mitchell DurhamAndré Yoshiaki KashiwabaraJose Miguel OrtegaBruno Tenório da Silveira LopesUniversidade de São PauloCiência da ComputaçãoUSPBR Aprendizado de máquina Bioinformática Bioinformatics Cadeia de Markov oculta generalizada Gene prediction Generalized hidden Markov model Machine learning Modelos probabilísticos Predição de genes Probabilistic models Na Bioinformática, o campo de pesquisa de predição computacional de genes codificadores de proteínas é um dos mais desafiadores e não sofreu muitos avanços na última década. Há basicamente dois grupos de métodos para predição de genes: métodos ab initio e métodos extrínsecos. O grupo ab initio ou intrínseco reúne os programas que realizam a predição apenas utilizando como entrada a sequência alvo. Esse grupo foca na busca por estruturas gênicas baseadas em sinais biológicos e trechos conservados. O outro grupo, chamado de extrínseco, reúne os programas que necessitam de outras sequências (de referência), além da sequência alvo para realizar a predição por meio do alinhamento da sequência alvo contra sequências de referência. Há também abordagens de predição, chamadas de híbridas, que tentam unir os dois métodos de predição incorporando alinhamentos para aumentar a precisão dos preditores ab initio. Nesse trabalho desenvolvemos uma extensão do arcabouço probabilístico ToPS para implementar duas técnicas de abordagens híbridas de predição e avaliar seus benefícios e méritos relativos. Os resultados obtidos mostram um claro benefício da inclusão de alinhamentos de genomas na predição, e prós e contras da inclusão de mapeamentos de transcritos. Além disso, construímos um modelo genérico para incluir num preditor de genes informações probabilísticas externas. Esse modelo é implementado no ToPS e pode ser usado para desenvolver mais estratégias de predição de genes. In Bioinformatics, the field of computational prediction of protein-coding genes is one of the most challenging and did not have many advances in the last decade. There are two main groups of methods for predicting genes: ab initio methods and extrinsic methods. The ab initio or intrinsic group includes the programs that perform the prediction using only the target sequence as input. This group focuses on the search for gene structures based on biological signals and preserved portions of the sequence. The other group, called extrinsic, consists of the programs that require other (reference) sequences in addition to the target sequence to perform the prediction by aligning the target sequence against reference sequences. There are also prediction approaches that attempt to join the two prediction methods, called the hybrid, incorporating alignments to increase the precision of the ab initio predictors. In this dissertation we developed an extension of the ToPS computational framework to implement two hybrid prediction techniques and assess their benefits and relative merits. The results obtained show a clear benefit from including genome alignments in the prediction and the pros and cons of using transcript mapping. Additionally, we have devised a generic model to include probabilistic extraneous information into a gene predictor. This model is implemented in ToPS and can be used to further develop gene prediction strategies. https://doi.org/10.11606/D.45.2019.tde-28092019-175959info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T20:21:34Zoai:teses.usp.br:tde-28092019-175959Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T13:27:24.212238Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Predição de genes ab initio combinada com informações de alinhamento
dc.title.alternative.en.fl_str_mv Ab initio gene prediction combined with alignment information
title Predição de genes ab initio combinada com informações de alinhamento
spellingShingle Predição de genes ab initio combinada com informações de alinhamento
Bruno Tenório da Silveira Lopes
title_short Predição de genes ab initio combinada com informações de alinhamento
title_full Predição de genes ab initio combinada com informações de alinhamento
title_fullStr Predição de genes ab initio combinada com informações de alinhamento
title_full_unstemmed Predição de genes ab initio combinada com informações de alinhamento
title_sort Predição de genes ab initio combinada com informações de alinhamento
author Bruno Tenório da Silveira Lopes
author_facet Bruno Tenório da Silveira Lopes
author_role author
dc.contributor.advisor1.fl_str_mv Alan Mitchell Durham
dc.contributor.referee1.fl_str_mv André Yoshiaki Kashiwabara
dc.contributor.referee2.fl_str_mv Jose Miguel Ortega
dc.contributor.author.fl_str_mv Bruno Tenório da Silveira Lopes
contributor_str_mv Alan Mitchell Durham
André Yoshiaki Kashiwabara
Jose Miguel Ortega
description Na Bioinformática, o campo de pesquisa de predição computacional de genes codificadores de proteínas é um dos mais desafiadores e não sofreu muitos avanços na última década. Há basicamente dois grupos de métodos para predição de genes: métodos ab initio e métodos extrínsecos. O grupo ab initio ou intrínseco reúne os programas que realizam a predição apenas utilizando como entrada a sequência alvo. Esse grupo foca na busca por estruturas gênicas baseadas em sinais biológicos e trechos conservados. O outro grupo, chamado de extrínseco, reúne os programas que necessitam de outras sequências (de referência), além da sequência alvo para realizar a predição por meio do alinhamento da sequência alvo contra sequências de referência. Há também abordagens de predição, chamadas de híbridas, que tentam unir os dois métodos de predição incorporando alinhamentos para aumentar a precisão dos preditores ab initio. Nesse trabalho desenvolvemos uma extensão do arcabouço probabilístico ToPS para implementar duas técnicas de abordagens híbridas de predição e avaliar seus benefícios e méritos relativos. Os resultados obtidos mostram um claro benefício da inclusão de alinhamentos de genomas na predição, e prós e contras da inclusão de mapeamentos de transcritos. Além disso, construímos um modelo genérico para incluir num preditor de genes informações probabilísticas externas. Esse modelo é implementado no ToPS e pode ser usado para desenvolver mais estratégias de predição de genes.
publishDate 2019
dc.date.issued.fl_str_mv 2019-04-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/D.45.2019.tde-28092019-175959
url https://doi.org/10.11606/D.45.2019.tde-28092019-175959
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794503120641851392