Classification and structure-based inference of transcriptional regulatory proteins

Detalhes bibliográficos
Autor(a) principal: Barros, Diana Manuela Pinto
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/1822/49099
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_32e687d8f7a040d34370059ab0d5e77c
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/49099
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Classification and structure-based inference of transcriptional regulatory proteinsTranscription factorsProtein functional domainsEscherichia coliRegulatory functionTwo-component signal transduction systemsGlobal TFsFactores de transcriçãoDomínios proteicos funcionaisEscherichia coliFuncção regulatóriaEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformáticaTranscription factors (TFs) are proteins that mediate the cellular response to the changes of the surrounding environment. Studying their functional domains and protein structure is fundamental in order to gain insight of the way they are triggered and how they shape genetic transcription. The current work aimed for classifying both TFs and functional domains, understanding which features can be related to the different functions of the TFs. By using UniProtJAPI, a JAVA library that allows remote access to UniProt, the information of 200 Escherichia coli’s (E. coli) TFs has been retrieved. This data was manually curated, in order to remove domain duplicates and other excess information, and to add missing domains. The obtained functional domains were classified according to their molecular function, while the TFs were classified according to their regulatory function. TFs that exclusively induce gene expression were classified as activators, while TFs that only perform gene repression were classified as repressors. On the other hand, TFs that perform both the activation and repression of transcription were classified as duals. The information was then analysed altogether in order to understand what relationships between the TFs’ function and functional domains could exist. Several analysis were performed, which include statistical tests and clustering methods. Along with the analysis of the full list of TFs, TFs that are part of two-component signal transduction systems and global TFs were given special focus, due to their important role in cellular function. The results showed that there is a relationship between the functional domains and the regulatory function of the different TFs. This may be related to the evolutionary relationships between repressors and activators. It is also understandable that dual regulators are closely related to activators and repressors than what activators and repressors are to each other. Moreover, TFs of two-component signal transduction systems are similar to each other, given that they perform similar functions. Their domain architectures are also predictable and do not vary from what was expected of these TFs. However, in global TFs the results are opposite of the ones obtained for two-component system TFs: their structures are very different from each other and each TF is specific. The amount of different domains is high when comparing to the full sample of TFs, since the number of domains exceeds the number of TFs. Domains of all classification types are present in their structure and the domain architectures are varied, which reflects their different activities within the cell.Os factores de transcrição (TFs) são proteínas que mediam resposta celular perante alterações do meio em que se inserem. Estudar os seus domínios funcionais e estrutura proteica é fundamental para compreender a forma como as suas funções são desencadeadas e como moldam a regulação da transcrição. Este trabalho teve como objectivos a classificação dos TFs de acordo com a sua função, assim como a classificação dos domínios funcionais. Através do uso da UniProtJAPI, uma biblioteca de JAVA que permite o acesso remoto à UniProt, foi recolhida informação de 200 TFs da Escherichia coli (E. coli). Estes dados foram curados manualmente, com o objectivo de remover domínios duplicados e outra informação em excesso, assim como de adicionar domínios em falta. Os domínios funcionais obtidos foram classificados de acordo com a sua função molecular, enquanto que os TFs foram classificados de acordo com a sua função regulatória. TFs que exclusivamente induzem a expressão genética foram classificados como activadores, enquanto que TFs que apenas reprimem a expressão genética foram classificados como repressores. Por usa vez, TFs que tanto induzem como reprimem a expressão genética foram classificados como duais. A informação dos domínios e dos TFs foi considerada como um todo de forma a compreender quais as possíveis relações entre a função regulatória dos TFs e os domínios funcionais. Várias análises foram efectuadas, das quais testes estatísticos e métodos de clustering. Para além da análise de todos os TFs, foi também feita uma análise de TFs que fazem parte de two-component transduction systems e TFs globais, devido à sua importância na actividade celular. Os resultados demonstram que existe uma relação entre os domínios funcionais e a função regulatória dos TFs. Esta pode ter a ver com as relações evolucionárias dos activadores e repressores. É, também, perceptível que os reguladores duais relacionam-se com mais proximidade dos activadores e dos repressores do que os activadores e os repressores se relacionam entre si. Para além disso, TFs de two-component transduction systems têm estruturas semelhantes , uma vez que desempenham funções idênticas. As duas arquitecturas de domínios também são previsíveis e não variam do que era esperado. Contudo, para os TFs globais, os resultados são antagónicos: as suas estruturas são diferentes umas das outras e cada TF é específico. A quantidade de domínios diferentes é elevada em comparação com a amostra completa de TFs, uma vez que o número de domínios excede o número de TFs. Domínios de todas as classificações estão presentes na estrutura dos TFs globais e as arquitecturas de domínios são variadas, o que reflecte as suas actividades específicas na célula.Carneiro, S.Lourenço, Anália Maria GarciaUniversidade do MinhoBarros, Diana Manuela Pinto20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/49099eng201756200info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:16:58Zoai:repositorium.sdum.uminho.pt:1822/49099Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:09:31.767097Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Classification and structure-based inference of transcriptional regulatory proteins
title Classification and structure-based inference of transcriptional regulatory proteins
spellingShingle Classification and structure-based inference of transcriptional regulatory proteins
Barros, Diana Manuela Pinto
Transcription factors
Protein functional domains
Escherichia coli
Regulatory function
Two-component signal transduction systems
Global TFs
Factores de transcrição
Domínios proteicos funcionais
Escherichia coli
Funcção regulatória
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Classification and structure-based inference of transcriptional regulatory proteins
title_full Classification and structure-based inference of transcriptional regulatory proteins
title_fullStr Classification and structure-based inference of transcriptional regulatory proteins
title_full_unstemmed Classification and structure-based inference of transcriptional regulatory proteins
title_sort Classification and structure-based inference of transcriptional regulatory proteins
author Barros, Diana Manuela Pinto
author_facet Barros, Diana Manuela Pinto
author_role author
dc.contributor.none.fl_str_mv Carneiro, S.
Lourenço, Anália Maria Garcia
Universidade do Minho
dc.contributor.author.fl_str_mv Barros, Diana Manuela Pinto
dc.subject.por.fl_str_mv Transcription factors
Protein functional domains
Escherichia coli
Regulatory function
Two-component signal transduction systems
Global TFs
Factores de transcrição
Domínios proteicos funcionais
Escherichia coli
Funcção regulatória
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Transcription factors
Protein functional domains
Escherichia coli
Regulatory function
Two-component signal transduction systems
Global TFs
Factores de transcrição
Domínios proteicos funcionais
Escherichia coli
Funcção regulatória
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Bioinformática
publishDate 2016
dc.date.none.fl_str_mv 2016
2016-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/49099
url http://hdl.handle.net/1822/49099
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 201756200
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799132521031532544