Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPR |
Texto Completo: | https://hdl.handle.net/1884/73902 |
Resumo: | Orientadora: Profa. Dra. Liu Un Rigo |
id |
UFPR_8f0f6316d6068a7cb65d548663147f07 |
---|---|
oai_identifier_str |
oai:acervodigital.ufpr.br:1884/73902 |
network_acronym_str |
UFPR |
network_name_str |
Repositório Institucional da UFPR |
repository_id_str |
308 |
spelling |
Ferreira, Lucas Martins, 1986-Raittz, Roberto Tadeu, 1966-Costa, Paulo Afonso Bracarense, 1957-Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em BioinformáticaRigo, Liu Un2022-10-25T11:38:07Z2022-10-25T11:38:07Z2012https://hdl.handle.net/1884/73902Orientadora: Profa. Dra. Liu Un RigoCoorientadores: Roberto Tadeu Raittz, Paulo Afonso Bracarense CostaDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa : Curitiba, 28/02/2012Inclui referências: p. 60-66Resumo: A transcrição de vários genes bacterianos é regulada por fatores sigma alternativos da RNA polimerase como o sigma 54 ou sigma N. A sequência consenso (mrNrYTGGCACG-N4-TTGCWNNw) do fator sigma 54 esta localizada 12 pares de bases acima do sitio de iniciação da transcrição e as bases mais conservadas estão localizadas nas posições -25/-24 (GG, 100% de conservação) e -13/-12 (GC, 96% de conservação). Algumas abordagens utilizando modelos ocultos de Markov (HMM) são reportadas em literatura para identificação de sequências promotoras em genomas completos. No entanto, estes métodos não apresentam resultados satisfatórios. Neste teste utilizamos um algoritmo que pré-seleciona candidatos a promotores sigma 54 baseando no padrão de conservação. Os candidatos são então classificados utilizando uma rede neuronal artificial treinada com um conjunto de sequências de promotores sigma 54 validados e um conjunto de sequências improváveis composto por metade apresentando o dois nucleotídeos "GG" e "GC" mais conservados e a outra metade com bases aleatórias. O método foi testado com o genoma da bactéria Herbaspirillum seropedicae, resultando em 3148 sequências candidatas com os padrões de conservação "GG" e "GC". Dentre estes, 126 são considerados regiões verdadeiras de ligação do fator de transcrição sigma 54 pela rede neuronal. Todas as sequências validadas de fatores sigma 54 em H. seropedicae foram identificadas pelo programa . Portanto, nossa abordagem é capaz de detectar fatores de transcrição sigma 54.Abstract: The transcription of many bacterial genes is regulated by alternative sigma factors of the RNA polymerase such as the sigma 54 or sigma N. The consensus sequence (mrNrYTGGCACG-N4-TTGCWNNw) of the sigma 54 promoter is located 12 base pairs upstream of the transcription start site and the most conserved bases are located at the positions -25/-24 (GG, 100% conservation) and -13/-12 (GC, 96% conservation). Several approaches using Hidden Markov Models (HMM) have been reported in the literature to identify promoter sequences in whole genomes. However, these methods frequently do not show satisfactory results. In this test we used an algorithm that pre-sort candidates for sigma 54 promoter sequences based on the presence of the conserved motifs. The candidates are then screened using an artificial neural network trained with a set of validated sigma 54 promoter sequences and another set of improbable sequences composed by half showing the two dinucleotides "GG" and "GC" most highly conserved and the another half with random bases. We also tested the method in the whole genome sequence of the bacterium Herbaspirillum seropedicae, resulting in 3148 candidate regions with the conserved GG and GC motifs. Out of these, 126 were considered true sigma 54-dependent promoter by the trained neural network. All the validated sigma 54 promoters of H. seropedicae were identified by our software. Therefore, our approach is capable of reliable detection of sigma 54 promoters.1 recurso online : PDF.application/pdfRNA polimerasesBioinformáticaSoftware - DesenvolvimentoDesenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificialinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - LUCAS MARTINS FERREIRA.pdfapplication/pdf4032879https://acervodigital.ufpr.br/bitstream/1884/73902/1/R%20-%20D%20-%20LUCAS%20MARTINS%20FERREIRA.pdfbb75bf00832168a098e7bdb20a1dcfe6MD51open access1884/739022022-10-25 08:38:07.691open accessoai:acervodigital.ufpr.br:1884/73902Repositório de PublicaçõesPUBhttp://acervodigital.ufpr.br/oai/requestopendoar:3082022-10-25T11:38:07Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial |
title |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial |
spellingShingle |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial Ferreira, Lucas Martins, 1986- RNA polimerases Bioinformática Software - Desenvolvimento |
title_short |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial |
title_full |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial |
title_fullStr |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial |
title_full_unstemmed |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial |
title_sort |
Desenvolvimento de ferramenta computacional para identificação de promotores Sigma 54 utilizando rede neural artificial |
author |
Ferreira, Lucas Martins, 1986- |
author_facet |
Ferreira, Lucas Martins, 1986- |
author_role |
author |
dc.contributor.other.pt_BR.fl_str_mv |
Raittz, Roberto Tadeu, 1966- Costa, Paulo Afonso Bracarense, 1957- Universidade Federal do Paraná. Setor de Educação Profissional e Tecnológica. Programa de Pós-Graduação em Bioinformática |
dc.contributor.author.fl_str_mv |
Ferreira, Lucas Martins, 1986- |
dc.contributor.advisor1.fl_str_mv |
Rigo, Liu Un |
contributor_str_mv |
Rigo, Liu Un |
dc.subject.por.fl_str_mv |
RNA polimerases Bioinformática Software - Desenvolvimento |
topic |
RNA polimerases Bioinformática Software - Desenvolvimento |
description |
Orientadora: Profa. Dra. Liu Un Rigo |
publishDate |
2012 |
dc.date.issued.fl_str_mv |
2012 |
dc.date.accessioned.fl_str_mv |
2022-10-25T11:38:07Z |
dc.date.available.fl_str_mv |
2022-10-25T11:38:07Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/73902 |
url |
https://hdl.handle.net/1884/73902 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
1 recurso online : PDF. application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
instname_str |
Universidade Federal do Paraná (UFPR) |
instacron_str |
UFPR |
institution |
UFPR |
reponame_str |
Repositório Institucional da UFPR |
collection |
Repositório Institucional da UFPR |
bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/73902/1/R%20-%20D%20-%20LUCAS%20MARTINS%20FERREIRA.pdf |
bitstream.checksum.fl_str_mv |
bb75bf00832168a098e7bdb20a1dcfe6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1813898887860060160 |