Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UCS |
Texto Completo: | https://repositorio.ucs.br/handle/11338/691 |
Resumo: | A região promotora é uma sequência de DNA localizada anteriormente à uma região codificante e é responsável por iniciar o processo de transcrição. Deste modo, atua como um elemento regulador. O estudo da regulação da expressão gênica auxilia na compreensão da maquinária vital dos seres vivos, no conhecimento sobre a funcionalidade dos genes em diferentes espécies, na resposta celular frente às mudanças ambientais, entre outras questões. Embora os métodos computacionais para a predição de genes possuam uma boa acurácia o mesmo não é conseguido para os promotores. Esta dificuldade se deve ao tamanho reduzido do promotor e ao padrão pouco conservado, o que gera resultados com alto número de falsos positivos. Esta tese teve como objetivo a utilização de Redes Neurais Artificiais na predição, caracterização e reconhecimento de promotores de bactérias Gramnegativas. Diferente de outros trabalhos, a predição realizada não foi limitada apenas aos promotores dos genes constitutivos; foi realizada também para as demais classes de sequências promotoras. Além da abordagem clássica utilizando a composição de nucleotídeos foram empregados os valores de estabilidade da sequência. De modo a otimizar o aprendizado da Rede Neural e implementar uma ferramenta própria para a predição de promotores, foram extraídas regras de inferência (baseadas no conhecimento produzido durante o treinamento da rede) que foram ponderadas e implementadas em uma nova ferramenta, chamada BacPP. Até o presente, os resultados obtidos com o BacPP foram satisfatórios e comparáveis com a literatura. Os valores de exatidão obtidos com o BacPP para os fatores σ24, σ28, σ32, σ38, σ54 e σ70 de E. coli foram, 86,9%; 92,8%; 91,5%; 89,3%; 97,0%; 83,6%, respectivamente. Quando a ferramenta foi aplicada em promotores pertencentes a outras bactérias Gram-negativas, a exatidão geral foi de 76%. Considerando a importância da predição de promotores e a ausência de banco de dados com informações para outras bactérias, implementou-se o IntergenicDB, um banco de dados com diversas informações sobre as sequencias intergênicas e o valor de classificação destas para os diferentes fatores σ bacterianos, conforme os resultados obtidos com o BacPP. |
id |
UCS_aa9285a2fd38fca2ec1dcd3fef79bcec |
---|---|
oai_identifier_str |
oai:repositorio.ucs.br:11338/691 |
network_acronym_str |
UCS |
network_name_str |
Repositório Institucional da UCS |
repository_id_str |
|
spelling |
Silva, Scheila de Avila eLemke, NeyFerreira, Henrique BunselmeyerRibeiro, Helena GraziottinEcheverrigaray, SérgioGerhardt, Günther Johannes Lewczuk2014-06-17T12:01:02Z2014-06-17T12:01:02Z2014-06-172011-12-19https://repositorio.ucs.br/handle/11338/691A região promotora é uma sequência de DNA localizada anteriormente à uma região codificante e é responsável por iniciar o processo de transcrição. Deste modo, atua como um elemento regulador. O estudo da regulação da expressão gênica auxilia na compreensão da maquinária vital dos seres vivos, no conhecimento sobre a funcionalidade dos genes em diferentes espécies, na resposta celular frente às mudanças ambientais, entre outras questões. Embora os métodos computacionais para a predição de genes possuam uma boa acurácia o mesmo não é conseguido para os promotores. Esta dificuldade se deve ao tamanho reduzido do promotor e ao padrão pouco conservado, o que gera resultados com alto número de falsos positivos. Esta tese teve como objetivo a utilização de Redes Neurais Artificiais na predição, caracterização e reconhecimento de promotores de bactérias Gramnegativas. Diferente de outros trabalhos, a predição realizada não foi limitada apenas aos promotores dos genes constitutivos; foi realizada também para as demais classes de sequências promotoras. Além da abordagem clássica utilizando a composição de nucleotídeos foram empregados os valores de estabilidade da sequência. De modo a otimizar o aprendizado da Rede Neural e implementar uma ferramenta própria para a predição de promotores, foram extraídas regras de inferência (baseadas no conhecimento produzido durante o treinamento da rede) que foram ponderadas e implementadas em uma nova ferramenta, chamada BacPP. Até o presente, os resultados obtidos com o BacPP foram satisfatórios e comparáveis com a literatura. Os valores de exatidão obtidos com o BacPP para os fatores σ24, σ28, σ32, σ38, σ54 e σ70 de E. coli foram, 86,9%; 92,8%; 91,5%; 89,3%; 97,0%; 83,6%, respectivamente. Quando a ferramenta foi aplicada em promotores pertencentes a outras bactérias Gram-negativas, a exatidão geral foi de 76%. Considerando a importância da predição de promotores e a ausência de banco de dados com informações para outras bactérias, implementou-se o IntergenicDB, um banco de dados com diversas informações sobre as sequencias intergênicas e o valor de classificação destas para os diferentes fatores σ bacterianos, conforme os resultados obtidos com o BacPP.The promoter region is located some few base pairs before a coding region. It is responsible for initiating gene expression process, thus, it can plays a regulatory role. The study about gene expression regulation can assist mainly in the comprehension of complex metabolic network presented by several organisms and cellular answer considering the environment changes. The computational methods to gene prediction have a good accuracy, but this is not achieved in promoter prediction. This difficulty occurs because of the length of the promoter and its degenerate pattern. Those features can explain results with a great number of false positives present in the literature. The present thesis has as its main goal the neural networks applied to Gram-negative promoter prediction, recognition and characterization. Beside the classical approach with the nucleotides of the sequence, the prediction was also made by using stability values. Aiming at developing a own tool for bacterial promoter prediction, the rules extraction was carried out and the results were weighted and implemented. This tool, named BacPP, presents results comparable with the related literature. Currently, the BacPP specific accuracy for σ24, σ28, σ32, σ38, σ54 and σ70 were 86,9%; 92,8%; 91,5%; 89,3%; 97,0%; 83,6%, respectively. Furthermore, when challenged with promoter sequences belonging to other enterobacteria BacPP maintained 76% accuracy overall. Currently, there is no databases dedicated for other Gram-negative promoter than E.coli. For this reason, IntergenicDB was modeled and implemented. This database was projected to collect several pieces of information about the sequences and the organisms to which they belong and, the classification results originated from BacPP for each sequence.Genética molecularGenesRedes neurais (Computação)Bactérias gram-negativasRedes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do Sulhttp://lattes.cnpq.br/7731423725040717SILVA, Scheila de Avila ePrograma de Pós-Graduação em BiotecnologiaTEXTTese Scheila de Avila e Silva.pdf.txtTese Scheila de Avila e Silva.pdf.txtExtracted texttext/plain203772https://repositorio.ucs.br/xmlui/bitstream/11338/691/3/Tese%20Scheila%20de%20Avila%20e%20Silva.pdf.txt280541b6268b0274bce05fc86ec319d4MD53THUMBNAILTese Scheila de Avila e Silva.pdf.jpgTese Scheila de Avila e Silva.pdf.jpgGenerated Thumbnailimage/jpeg1321https://repositorio.ucs.br/xmlui/bitstream/11338/691/4/Tese%20Scheila%20de%20Avila%20e%20Silva.pdf.jpgf282fec5c7143604f794b4b145701eb5MD54ORIGINALTese Scheila de Avila e Silva.pdfTese Scheila de Avila e Silva.pdfapplication/pdf5973071https://repositorio.ucs.br/xmlui/bitstream/11338/691/1/Tese%20Scheila%20de%20Avila%20e%20Silva.pdff889c78c177d3610ab61727477ea5cfcMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-8279https://repositorio.ucs.br/xmlui/bitstream/11338/691/2/license.txtdeeb8fa550aaa0758114cbdeb0c0955dMD5211338/6912018-09-28 16:41:39.074oai:repositorio.ucs.br:11338/691IERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gCiBEZWNsYXJhIHRhbWLDqW0gcXVlIGEgZW50cmVnYSBkbyBkb2N1bWVudG8gbsOjbyBpbmZyaW5nZSwgdGFudG8gcXVhbnRvIGxoZSDDqSBwb3Nzw612ZWwgc2FiZXIsIG9zIGRpcmVpdG9zIGRlIHF1YWxxdWVyIG91dHJhIHBlc3NvYSBvdSBlbnRpZGFkZS4KRepositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:03:58.730944Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false |
dc.title.pt_BR.fl_str_mv |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas |
title |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas |
spellingShingle |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas Silva, Scheila de Avila e Genética molecular Genes Redes neurais (Computação) Bactérias gram-negativas |
title_short |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas |
title_full |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas |
title_fullStr |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas |
title_full_unstemmed |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas |
title_sort |
Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas |
author |
Silva, Scheila de Avila e |
author_facet |
Silva, Scheila de Avila e |
author_role |
author |
dc.contributor.other.none.fl_str_mv |
Lemke, Ney Ferreira, Henrique Bunselmeyer Ribeiro, Helena Graziottin |
dc.contributor.author.fl_str_mv |
Silva, Scheila de Avila e |
dc.contributor.advisor1.fl_str_mv |
Echeverrigaray, Sérgio Gerhardt, Günther Johannes Lewczuk |
contributor_str_mv |
Echeverrigaray, Sérgio Gerhardt, Günther Johannes Lewczuk |
dc.subject.por.fl_str_mv |
Genética molecular Genes Redes neurais (Computação) Bactérias gram-negativas |
topic |
Genética molecular Genes Redes neurais (Computação) Bactérias gram-negativas |
description |
A região promotora é uma sequência de DNA localizada anteriormente à uma região codificante e é responsável por iniciar o processo de transcrição. Deste modo, atua como um elemento regulador. O estudo da regulação da expressão gênica auxilia na compreensão da maquinária vital dos seres vivos, no conhecimento sobre a funcionalidade dos genes em diferentes espécies, na resposta celular frente às mudanças ambientais, entre outras questões. Embora os métodos computacionais para a predição de genes possuam uma boa acurácia o mesmo não é conseguido para os promotores. Esta dificuldade se deve ao tamanho reduzido do promotor e ao padrão pouco conservado, o que gera resultados com alto número de falsos positivos. Esta tese teve como objetivo a utilização de Redes Neurais Artificiais na predição, caracterização e reconhecimento de promotores de bactérias Gramnegativas. Diferente de outros trabalhos, a predição realizada não foi limitada apenas aos promotores dos genes constitutivos; foi realizada também para as demais classes de sequências promotoras. Além da abordagem clássica utilizando a composição de nucleotídeos foram empregados os valores de estabilidade da sequência. De modo a otimizar o aprendizado da Rede Neural e implementar uma ferramenta própria para a predição de promotores, foram extraídas regras de inferência (baseadas no conhecimento produzido durante o treinamento da rede) que foram ponderadas e implementadas em uma nova ferramenta, chamada BacPP. Até o presente, os resultados obtidos com o BacPP foram satisfatórios e comparáveis com a literatura. Os valores de exatidão obtidos com o BacPP para os fatores σ24, σ28, σ32, σ38, σ54 e σ70 de E. coli foram, 86,9%; 92,8%; 91,5%; 89,3%; 97,0%; 83,6%, respectivamente. Quando a ferramenta foi aplicada em promotores pertencentes a outras bactérias Gram-negativas, a exatidão geral foi de 76%. Considerando a importância da predição de promotores e a ausência de banco de dados com informações para outras bactérias, implementou-se o IntergenicDB, um banco de dados com diversas informações sobre as sequencias intergênicas e o valor de classificação destas para os diferentes fatores σ bacterianos, conforme os resultados obtidos com o BacPP. |
publishDate |
2011 |
dc.date.submitted.none.fl_str_mv |
2011-12-19 |
dc.date.accessioned.fl_str_mv |
2014-06-17T12:01:02Z |
dc.date.available.fl_str_mv |
2014-06-17T12:01:02Z |
dc.date.issued.fl_str_mv |
2014-06-17 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ucs.br/handle/11338/691 |
url |
https://repositorio.ucs.br/handle/11338/691 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS |
instname_str |
Universidade de Caxias do Sul (UCS) |
instacron_str |
UCS |
institution |
UCS |
reponame_str |
Repositório Institucional da UCS |
collection |
Repositório Institucional da UCS |
bitstream.url.fl_str_mv |
https://repositorio.ucs.br/xmlui/bitstream/11338/691/3/Tese%20Scheila%20de%20Avila%20e%20Silva.pdf.txt https://repositorio.ucs.br/xmlui/bitstream/11338/691/4/Tese%20Scheila%20de%20Avila%20e%20Silva.pdf.jpg https://repositorio.ucs.br/xmlui/bitstream/11338/691/1/Tese%20Scheila%20de%20Avila%20e%20Silva.pdf https://repositorio.ucs.br/xmlui/bitstream/11338/691/2/license.txt |
bitstream.checksum.fl_str_mv |
280541b6268b0274bce05fc86ec319d4 f282fec5c7143604f794b4b145701eb5 f889c78c177d3610ab61727477ea5cfc deeb8fa550aaa0758114cbdeb0c0955d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS) |
repository.mail.fl_str_mv |
|
_version_ |
1813258446579957760 |