Characterization and annotation of archaeal promoter sequences
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UCS |
Texto Completo: | https://repositorio.ucs.br/11338/10023 |
Resumo: | As arqueas foram incluídas como um domínio particular da árvore da vida há pouco tempo. Esse vasto e inexplorado domínio requer várias técnicas voltadas a produzir inferências confiáveis uma vex que não há muita informação anotada. O objetivo dessa tese é criar uma pipeline de bioinformática que encontra promotores nos genomas não anotados de arqueas. Para tal, a conservação reportada nos sítios de ligação de proteínas de fatores de transcrição é considerado para desenhar um perfil de sequências promotoras derivado de promotores experimentalmente dos organismos Haloferax volcanii, Thermococus kodakarensis, Sulfolobus solfataricus. Além disso, o aspecto conservado desses organismo é aplicado em uma tarefa classificatória baseada em redes neurais artificiais e estatística. Os resultados obtidos nessa tese são demonstrados através de dois artigos científicos. No primeiro, o sítio de ligação de proteínas de fatores de transcrição que auxiliam a ligação da enzima RNAP foram localizados em sequências promotoras que carecem dos sítios de ligação tradicionais. Em segundo, uma combinação de estatística e redes neurais artificiais mostrou-se bem sucedido ao classificar promotores de arqueastes-vos em uma taxa > 90%, o que demonstra uma maneira satisfatória de entregar anotação genômica em sequências de organismos cujo o genoma ainda não está totalmente explorado. [resumo fornecido pelo autor] |
id |
UCS_59aca83f5cbe6f29d0edbaa5c937eef3 |
---|---|
oai_identifier_str |
oai:repositorio.ucs.br:11338/10023 |
network_acronym_str |
UCS |
network_name_str |
Repositório Institucional da UCS |
repository_id_str |
|
spelling |
Martinez, Gustavo SganzerlaKumar, AdityaLaguna, Sergio EcheverrigarayYella, Venkata RejeshGálan Vásquez, EdgardoSilva, Sheila de Avila e2022-05-16T17:29:29Z2022-05-16T17:29:29Z2022-05-112021-11-05https://repositorio.ucs.br/11338/10023As arqueas foram incluídas como um domínio particular da árvore da vida há pouco tempo. Esse vasto e inexplorado domínio requer várias técnicas voltadas a produzir inferências confiáveis uma vex que não há muita informação anotada. O objetivo dessa tese é criar uma pipeline de bioinformática que encontra promotores nos genomas não anotados de arqueas. Para tal, a conservação reportada nos sítios de ligação de proteínas de fatores de transcrição é considerado para desenhar um perfil de sequências promotoras derivado de promotores experimentalmente dos organismos Haloferax volcanii, Thermococus kodakarensis, Sulfolobus solfataricus. Além disso, o aspecto conservado desses organismo é aplicado em uma tarefa classificatória baseada em redes neurais artificiais e estatística. Os resultados obtidos nessa tese são demonstrados através de dois artigos científicos. No primeiro, o sítio de ligação de proteínas de fatores de transcrição que auxiliam a ligação da enzima RNAP foram localizados em sequências promotoras que carecem dos sítios de ligação tradicionais. Em segundo, uma combinação de estatística e redes neurais artificiais mostrou-se bem sucedido ao classificar promotores de arqueastes-vos em uma taxa > 90%, o que demonstra uma maneira satisfatória de entregar anotação genômica em sequências de organismos cujo o genoma ainda não está totalmente explorado. [resumo fornecido pelo autor]Archaea were not long ago included as a particular domain in the tree of life. This vast and unexplored domain requires a plethora of techniques aimed to produce reliable inferences on it since not much information has been annotated. The objective of this thesis is to create a bioinformatics pipeline that encounters promoters in unannotated genomes of archaea. To perform such task, the conservation reported in the binding site of specific transcription factor proteins is considered in order to draw a profile of promoter-like sequences derived from experimentally validated promoters of the archaea H. volcanii, S. solfataricus, and T. kodakarensis. Additionally, the conserved aspect of these organisms is employed is a classification task based on statistics and artificial neural networks. The results obtained in this thesis are displayed in the form of two scientific articles. Where in the first, the binding site of transcription factor proteins that assist RNAP binding was located even in promoter sequences that lack the canonical binding sites as well as unannotated organisms. Secondly, a combination of statistics and artificial neural network classification has succeeded in classifying archaeal promoters in a rate > 90%, which has shown a satisfactory way to deliver annotation upon sequences whose genome is not fully explored. [resumo fornecido pelo autor]Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, CAPESDNAArchaeaDNABiotecnologiaArchaeaBiotechnologyCharacterization and annotation of archaeal promoter sequencesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisengreponame:Repositório Institucional da UCSinstname:Universidade de Caxias do Sul (UCS)instacron:UCSinfo:eu-repo/semantics/openAccessUniversidade de Caxias do Sulhttp://lattes.cnpq.br/9113021005582564Gustavo Sganzerla MartinezDoutorado em BiotecnologiaCampus Universitário de Caxias do SulTEXTTese Gustavo Sganzerla Martinez.pdf.txtTese Gustavo Sganzerla Martinez.pdf.txtExtracted texttext/plain194464https://repositorio.ucs.br/xmlui/bitstream/11338/10023/2/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.txted26306c1da2ee3062f3162fd9bf98aeMD52THUMBNAILTese Gustavo Sganzerla Martinez.pdf.jpgTese Gustavo Sganzerla Martinez.pdf.jpgGenerated Thumbnailimage/jpeg1166https://repositorio.ucs.br/xmlui/bitstream/11338/10023/3/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.jpg0f78f2f745fa86a8c02350ac972cd717MD53ORIGINALTese Gustavo Sganzerla Martinez.pdfTese Gustavo Sganzerla Martinez.pdfapplication/pdf6994679https://repositorio.ucs.br/xmlui/bitstream/11338/10023/1/Tese%20Gustavo%20Sganzerla%20Martinez.pdf87e3d9db5bf7f2317b1c6333a0577d5bMD5111338/100232022-10-18 17:43:33.81oai:repositorio.ucs.br:11338/10023Repositório de Publicaçõeshttp://repositorio.ucs.br/oai/requestopendoar:2024-05-06T10:00:34.895073Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS)false |
dc.title.en.fl_str_mv |
Characterization and annotation of archaeal promoter sequences |
title |
Characterization and annotation of archaeal promoter sequences |
spellingShingle |
Characterization and annotation of archaeal promoter sequences Martinez, Gustavo Sganzerla DNA Archaea DNA Biotecnologia Archaea Biotechnology |
title_short |
Characterization and annotation of archaeal promoter sequences |
title_full |
Characterization and annotation of archaeal promoter sequences |
title_fullStr |
Characterization and annotation of archaeal promoter sequences |
title_full_unstemmed |
Characterization and annotation of archaeal promoter sequences |
title_sort |
Characterization and annotation of archaeal promoter sequences |
author |
Martinez, Gustavo Sganzerla |
author_facet |
Martinez, Gustavo Sganzerla |
author_role |
author |
dc.contributor.other.none.fl_str_mv |
Kumar, Aditya Laguna, Sergio Echeverrigaray Yella, Venkata Rejesh Gálan Vásquez, Edgardo |
dc.contributor.author.fl_str_mv |
Martinez, Gustavo Sganzerla |
dc.contributor.advisor1.fl_str_mv |
Silva, Sheila de Avila e |
contributor_str_mv |
Silva, Sheila de Avila e |
dc.subject.e.fl_str_mv |
DNA |
topic |
DNA Archaea DNA Biotecnologia Archaea Biotechnology |
dc.subject.por.fl_str_mv |
Archaea DNA Biotecnologia |
dc.subject.eng.fl_str_mv |
Archaea Biotechnology |
description |
As arqueas foram incluídas como um domínio particular da árvore da vida há pouco tempo. Esse vasto e inexplorado domínio requer várias técnicas voltadas a produzir inferências confiáveis uma vex que não há muita informação anotada. O objetivo dessa tese é criar uma pipeline de bioinformática que encontra promotores nos genomas não anotados de arqueas. Para tal, a conservação reportada nos sítios de ligação de proteínas de fatores de transcrição é considerado para desenhar um perfil de sequências promotoras derivado de promotores experimentalmente dos organismos Haloferax volcanii, Thermococus kodakarensis, Sulfolobus solfataricus. Além disso, o aspecto conservado desses organismo é aplicado em uma tarefa classificatória baseada em redes neurais artificiais e estatística. Os resultados obtidos nessa tese são demonstrados através de dois artigos científicos. No primeiro, o sítio de ligação de proteínas de fatores de transcrição que auxiliam a ligação da enzima RNAP foram localizados em sequências promotoras que carecem dos sítios de ligação tradicionais. Em segundo, uma combinação de estatística e redes neurais artificiais mostrou-se bem sucedido ao classificar promotores de arqueastes-vos em uma taxa > 90%, o que demonstra uma maneira satisfatória de entregar anotação genômica em sequências de organismos cujo o genoma ainda não está totalmente explorado. [resumo fornecido pelo autor] |
publishDate |
2021 |
dc.date.submitted.none.fl_str_mv |
2021-11-05 |
dc.date.accessioned.fl_str_mv |
2022-05-16T17:29:29Z |
dc.date.available.fl_str_mv |
2022-05-16T17:29:29Z |
dc.date.issued.fl_str_mv |
2022-05-11 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ucs.br/11338/10023 |
url |
https://repositorio.ucs.br/11338/10023 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul (UCS) instacron:UCS |
instname_str |
Universidade de Caxias do Sul (UCS) |
instacron_str |
UCS |
institution |
UCS |
reponame_str |
Repositório Institucional da UCS |
collection |
Repositório Institucional da UCS |
bitstream.url.fl_str_mv |
https://repositorio.ucs.br/xmlui/bitstream/11338/10023/2/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.txt https://repositorio.ucs.br/xmlui/bitstream/11338/10023/3/Tese%20Gustavo%20Sganzerla%20Martinez.pdf.jpg https://repositorio.ucs.br/xmlui/bitstream/11338/10023/1/Tese%20Gustavo%20Sganzerla%20Martinez.pdf |
bitstream.checksum.fl_str_mv |
ed26306c1da2ee3062f3162fd9bf98ae 0f78f2f745fa86a8c02350ac972cd717 87e3d9db5bf7f2317b1c6333a0577d5b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UCS - Universidade de Caxias do Sul (UCS) |
repository.mail.fl_str_mv |
|
_version_ |
1813258427278819328 |