Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial

Detalhes bibliográficos
Autor(a) principal: Ferreira, Lucas Martins, 1986-
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPR
Texto Completo: https://hdl.handle.net/1884/73902
Resumo: Orientadora: Profa. Dra. Liu Un Rigo
id UFPR_8f0f6316d6068a7cb65d548663147f07
oai_identifier_str oai:acervodigital.ufpr.br:1884/73902
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str 308
spelling Ferreira, Lucas Martins, 1986-Raittz, Roberto Tadeu, 1966-Costa, Paulo Afonso Bracarense, 1957-Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em BioinformáticaRigo, Liu Un2022-10-25T11:38:07Z2022-10-25T11:38:07Z2012https://hdl.handle.net/1884/73902Orientadora: Profa. Dra. Liu Un RigoCoorientadores: Roberto Tadeu Raittz, Paulo Afonso Bracarense CostaDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 28/02/2012Inclui referências: p. 60-66Resumo: A transcrição de vários genes bacterianos é regulada por fatores sigma alternativos da RNA polimerase como o sigma 54 ou sigma N. A sequência consenso (mrNrYTGGCACG-N4-TTGCWNNw) do fator sigma 54 esta localizada 12 pares de bases acima do sitio de iniciação da transcrição e as bases mais conservadas estão localizadas nas posições -25/-24 (GG, 100% de conservação) e -13/-12 (GC, 96% de conservação). Algumas abordagens utilizando modelos ocultos de Markov (HMM) são reportadas em literatura para identificação de sequências promotoras em genomas completos. No entanto, estes métodos não apresentam resultados satisfatórios. Neste teste utilizamos um algoritmo que pré-seleciona candidatos a promotores sigma 54 baseando no padrão de conservação. Os candidatos são então classificados utilizando uma rede neuronal artificial treinada com um conjunto de sequências de promotores sigma 54 validados e um conjunto de sequências improváveis composto por metade apresentando o dois nucleotídeos "GG" e "GC" mais conservados e a outra metade com bases aleatórias. O método foi testado com o genoma da bactéria Herbaspirillum seropedicae, resultando em 3148 sequências candidatas com os padrões de conservação "GG" e "GC". Dentre estes, 126 são considerados regiões verdadeiras de ligação do fator de transcrição sigma 54 pela rede neuronal. Todas as sequências validadas de fatores sigma 54 em H. seropedicae foram identificadas pelo programa . Portanto, nossa abordagem é capaz de detectar fatores de transcrição sigma 54.Abstract: The transcription of many bacterial genes is regulated by alternative sigma factors of the RNA polymerase such as the sigma 54 or sigma N. The consensus sequence (mrNrYTGGCACG-N4-TTGCWNNw) of the sigma 54 promoter is located 12 base pairs upstream of the transcription start site and the most conserved bases are located at the positions -25/-24 (GG, 100% conservation) and -13/-12 (GC, 96% conservation). Several approaches using Hidden Markov Models (HMM) have been reported in the literature to identify promoter sequences in whole genomes. However, these methods frequently do not show satisfactory results. In this test we used an algorithm that pre-sort candidates for sigma 54 promoter sequences based on the presence of the conserved motifs. The candidates are then screened using an artificial neural network trained with a set of validated sigma 54 promoter sequences and another set of improbable sequences composed by half showing the two dinucleotides "GG" and "GC" most highly conserved and the another half with random bases. We also tested the method in the whole genome sequence of the bacterium Herbaspirillum seropedicae, resulting in 3148 candidate regions with the conserved GG and GC motifs. Out of these, 126 were considered true sigma 54-dependent promoter by the trained neural network. All the validated sigma 54 promoters of H. seropedicae were identified by our software. Therefore, our approach is capable of reliable detection of sigma 54 promoters.1 recurso online : PDF.application/pdfRNA polimerasesBioinformáticaSoftware - DesenvolvimentoDesenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificialinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - LUCAS MARTINS FERREIRA.pdfapplication/pdf4032879https://acervodigital.ufpr.br/bitstream/1884/73902/1/R%20-%20D%20-%20LUCAS%20MARTINS%20FERREIRA.pdfbb75bf00832168a098e7bdb20a1dcfe6MD51open access1884/739022022-10-25 08:38:07.691open accessoai:acervodigital.ufpr.br:1884/73902Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082022-10-25T11:38:07Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
title Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
spellingShingle Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
Ferreira, Lucas Martins, 1986-
RNA polimerases
Bioinformática
Software - Desenvolvimento
title_short Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
title_full Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
title_fullStr Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
title_full_unstemmed Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
title_sort Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
author Ferreira, Lucas Martins, 1986-
author_facet Ferreira, Lucas Martins, 1986-
author_role author
dc.contributor.other.pt_BR.fl_str_mv Raittz, Roberto Tadeu, 1966-
Costa, Paulo Afonso Bracarense, 1957-
Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática
dc.contributor.author.fl_str_mv Ferreira, Lucas Martins, 1986-
dc.contributor.advisor1.fl_str_mv Rigo, Liu Un
contributor_str_mv Rigo, Liu Un
dc.subject.por.fl_str_mv RNA polimerases
Bioinformática
Software - Desenvolvimento
topic RNA polimerases
Bioinformática
Software - Desenvolvimento
description Orientadora: Profa. Dra. Liu Un Rigo
publishDate 2012
dc.date.issued.fl_str_mv 2012
dc.date.accessioned.fl_str_mv 2022-10-25T11:38:07Z
dc.date.available.fl_str_mv 2022-10-25T11:38:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/73902
url https://hdl.handle.net/1884/73902
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/73902/1/R%20-%20D%20-%20LUCAS%20MARTINS%20FERREIRA.pdf
bitstream.checksum.fl_str_mv bb75bf00832168a098e7bdb20a1dcfe6
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv
_version_ 1801860844921815040