Classification and structure-based inference of transcriptional regulatory proteins
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/1822/49099 |
Resumo: | Dissertação de mestrado em Bioinformática |
id |
RCAP_32e687d8f7a040d34370059ab0d5e77c |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/49099 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Classification and structure-based inference of transcriptional regulatory proteinsTranscription factorsProtein functional domainsEscherichia coliRegulatory functionTwo-component signal transduction systemsGlobal TFsFactores de transcriçãoDomínios proteicos funcionaisEscherichia coliFuncção regulatóriaEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformáticaTranscription factors (TFs) are proteins that mediate the cellular response to the changes of the surrounding environment. Studying their functional domains and protein structure is fundamental in order to gain insight of the way they are triggered and how they shape genetic transcription. The current work aimed for classifying both TFs and functional domains, understanding which features can be related to the different functions of the TFs. By using UniProtJAPI, a JAVA library that allows remote access to UniProt, the information of 200 Escherichia coli’s (E. coli) TFs has been retrieved. This data was manually curated, in order to remove domain duplicates and other excess information, and to add missing domains. The obtained functional domains were classified according to their molecular function, while the TFs were classified according to their regulatory function. TFs that exclusively induce gene expression were classified as activators, while TFs that only perform gene repression were classified as repressors. On the other hand, TFs that perform both the activation and repression of transcription were classified as duals. The information was then analysed altogether in order to understand what relationships between the TFs’ function and functional domains could exist. Several analysis were performed, which include statistical tests and clustering methods. Along with the analysis of the full list of TFs, TFs that are part of two-component signal transduction systems and global TFs were given special focus, due to their important role in cellular function. The results showed that there is a relationship between the functional domains and the regulatory function of the different TFs. This may be related to the evolutionary relationships between repressors and activators. It is also understandable that dual regulators are closely related to activators and repressors than what activators and repressors are to each other. Moreover, TFs of two-component signal transduction systems are similar to each other, given that they perform similar functions. Their domain architectures are also predictable and do not vary from what was expected of these TFs. However, in global TFs the results are opposite of the ones obtained for two-component system TFs: their structures are very different from each other and each TF is specific. The amount of different domains is high when comparing to the full sample of TFs, since the number of domains exceeds the number of TFs. Domains of all classification types are present in their structure and the domain architectures are varied, which reflects their different activities within the cell.Os factores de transcrição (TFs) são proteínas que mediam resposta celular perante alterações do meio em que se inserem. Estudar os seus domínios funcionais e estrutura proteica é fundamental para compreender a forma como as suas funções são desencadeadas e como moldam a regulação da transcrição. Este trabalho teve como objectivos a classificação dos TFs de acordo com a sua função, assim como a classificação dos domínios funcionais. Através do uso da UniProtJAPI, uma biblioteca de JAVA que permite o acesso remoto à UniProt, foi recolhida informação de 200 TFs da Escherichia coli (E. coli). Estes dados foram curados manualmente, com o objectivo de remover domínios duplicados e outra informação em excesso, assim como de adicionar domínios em falta. Os domínios funcionais obtidos foram classificados de acordo com a sua função molecular, enquanto que os TFs foram classificados de acordo com a sua função regulatória. TFs que exclusivamente induzem a expressão genética foram classificados como activadores, enquanto que TFs que apenas reprimem a expressão genética foram classificados como repressores. Por usa vez, TFs que tanto induzem como reprimem a expressão genética foram classificados como duais. A informação dos domínios e dos TFs foi considerada como um todo de forma a compreender quais as possíveis relações entre a função regulatória dos TFs e os domínios funcionais. Várias análises foram efectuadas, das quais testes estatísticos e métodos de clustering. Para além da análise de todos os TFs, foi também feita uma análise de TFs que fazem parte de two-component transduction systems e TFs globais, devido à sua importância na actividade celular. Os resultados demonstram que existe uma relação entre os domínios funcionais e a função regulatória dos TFs. Esta pode ter a ver com as relações evolucionárias dos activadores e repressores. É, também, perceptível que os reguladores duais relacionam-se com mais proximidade dos activadores e dos repressores do que os activadores e os repressores se relacionam entre si. Para além disso, TFs de two-component transduction systems têm estruturas semelhantes , uma vez que desempenham funções idênticas. As duas arquitecturas de domínios também são previsíveis e não variam do que era esperado. Contudo, para os TFs globais, os resultados são antagónicos: as suas estruturas são diferentes umas das outras e cada TF é específico. A quantidade de domínios diferentes é elevada em comparação com a amostra completa de TFs, uma vez que o número de domínios excede o número de TFs. Domínios de todas as classificações estão presentes na estrutura dos TFs globais e as arquitecturas de domínios são variadas, o que reflecte as suas actividades específicas na célula.Carneiro, S.Lourenço, Anália Maria GarciaUniversidade do MinhoBarros, Diana Manuela Pinto20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/49099eng201756200info:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-07-21T12:16:58Zoai:repositorium.sdum.uminho.pt:1822/49099Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T19:09:31.767097Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Classification and structure-based inference of transcriptional regulatory proteins |
title |
Classification and structure-based inference of transcriptional regulatory proteins |
spellingShingle |
Classification and structure-based inference of transcriptional regulatory proteins Barros, Diana Manuela Pinto Transcription factors Protein functional domains Escherichia coli Regulatory function Two-component signal transduction systems Global TFs Factores de transcrição Domínios proteicos funcionais Escherichia coli Funcção regulatória Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
title_short |
Classification and structure-based inference of transcriptional regulatory proteins |
title_full |
Classification and structure-based inference of transcriptional regulatory proteins |
title_fullStr |
Classification and structure-based inference of transcriptional regulatory proteins |
title_full_unstemmed |
Classification and structure-based inference of transcriptional regulatory proteins |
title_sort |
Classification and structure-based inference of transcriptional regulatory proteins |
author |
Barros, Diana Manuela Pinto |
author_facet |
Barros, Diana Manuela Pinto |
author_role |
author |
dc.contributor.none.fl_str_mv |
Carneiro, S. Lourenço, Anália Maria Garcia Universidade do Minho |
dc.contributor.author.fl_str_mv |
Barros, Diana Manuela Pinto |
dc.subject.por.fl_str_mv |
Transcription factors Protein functional domains Escherichia coli Regulatory function Two-component signal transduction systems Global TFs Factores de transcrição Domínios proteicos funcionais Escherichia coli Funcção regulatória Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
topic |
Transcription factors Protein functional domains Escherichia coli Regulatory function Two-component signal transduction systems Global TFs Factores de transcrição Domínios proteicos funcionais Escherichia coli Funcção regulatória Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
description |
Dissertação de mestrado em Bioinformática |
publishDate |
2016 |
dc.date.none.fl_str_mv |
2016 2016-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/49099 |
url |
http://hdl.handle.net/1822/49099 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
201756200 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799132521031532544 |