A stochastic model of gene expression including splicing events
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10451/15849 |
Resumo: | Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2014 |
id |
RCAP_1fc1d1fe62047e5f0349127d4ed9a1db |
---|---|
oai_identifier_str |
oai:repositorio.ul.pt:10451/15849 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
A stochastic model of gene expression including splicing eventsTeses de mestrado - 2014Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2014Proteins carry out the great majority of the catalytic and structural work within an organism. The RNA templates used in their synthesis determines their identity, and this is dictated by which genes are transcribed. Therefore, gene expression is the fundamental determinant of an organism’s nature. The main objective of this thesis was to develop a stochastic computational model able to simulate the gene expression phenomena to best evaluate its critical points including the process of splicing. With this aim, an extended research was performed looking for already described similar models, identifying their strengths and weaknesses, approaches, languages and algorithms used. Here we present a model developed in Java, which is an object-oriented language or object-oriented programming (OOP) implementing the Gillespie’s algorithm. The model receives as input an array of 19 biological parameters. Although at first the model was time consuming and intense, it was optimized reducing the simulation time in approximately 250%. With this model we wish to take a closer look at the regulation of gene expression, evaluating it with greater accuracy. For that purpose we varied the values of the transcription initiation, RNA degradation and protein degradation rate constants. The results evidenced that the transcription initiation and RNA degradation present the same level of control towards the influence of pre-mRNA, mRNA and protein numbers; in terms of protein numbers, their influence is lower when compared with the protein degradation constant (which has no influence on RNAs numbers).A informação genética de cada indivíduo está guardada no seu DNA, uma biomolécula de armazenamento muito estável, de forma a garantir a integridade dos genes de cada um. Contudo sendo muito estável e imutável também torna muito difícil o acesso à informação que contém. É necessário transcrever essa informação para um outro tipo de molécula mais ativa. É este o conceito por detrás da expressão génica. A expressão génica pode ser resumida em dois passos fundamentais: a transcrição e a tradução. O primeiro é a etapa durante a qual o RNA mensageiro (mRNA) é produzido de acordo com o gene que serve como molde. No passo seguinte o mRNA vai servir de base para que o seu conteúdo seja traduzido pelos ribossomas para uma nova molécula, a proteína. As proteínas desempenham a grande maioria das funções catalíticas necessárias a um organismo. O RNA, utilizado como base para a sua síntese, determina a sua identidade e esta é ditada pelo gene que anteriormente serviu de molde à sua produção. Assim, não é de admirar que o processo de expressão génica seja tão importante como crítico. Defeitos ou anomalias ao nível da transcrição são responsáveis pela origem de grande parte das doenças que afetam a espécie humana. A maioria dos genes eucariotas (e alguns procariotas) são expressos como um precursor do mRNA que é editado e transformado na forma madura do mRNA. A este processo dá-se o nome de splicing, este passo também essencial é o momento em que porções não codificantes presentes no pré-mRNA (intrões de região intragénica) são removidas e as regiões codificantes (exões) são unidas dando origem ao mRNA. A expressão génica é em si um processo denominado estocástico. A palavra ‘estocástico’ significa ‘aleatório’ do grego ` que significa ‘adivinhar’. Os genes são ativados por associações e dissociações aleatórias, a transcrição é tipicamente rara e muitas proteínas são expressas em baixa quantidade por célula. Ao nível celular, a dinâmica química é frequentemente determinada pela ação de apenas um punhado de moléculas, consequentemente flutuações ao nível molecular podem controlar a dinâmica da célula. Em teoria probabilística um processo estocástico, ou aleatório, é descrito como um conjunto de variáveis aleatórias. Contrariamente ao processo determinístico, ao invés de descrever um processo de uma forma que terá apenas um resultado possível, como por exemplo a resolução de equações diferenciais ordinárias, num processo estocástico há um certo grau de indeterminação. Mesmo quando o ponto de início da simulação é conhecido há vários caminhos pelos quais a simulação pode evoluir. De um ponto de vista bioinformático a abordagem por nós seguida, e que culminou no trabalho desta tese, teve como principal objetivo desenvolver um modelo informático de simulação estocástica do processo de transcrição e tradução génica incluindo o fenómeno de splicing no processo de maturação dos pré-mRNAs em mRNA maduros. Com o desenvolvimento deste programa é pretendido que seja melhor possível avaliar/identificar os locais de maior impacto e, por consequência, controlo destes, de todo o decorrer da expressão génica. Neste sentido foi feita uma extensa pesquisa bibliográfica, tentando identificar modelos já existentes reconhecendo tanto as suas mais-valias como as desvantagens, formas de abordagem ao problema, linguagem, algoritmos de iteração usados e conclusões obtidas. Com a informação recolhida foi por nós desenhado um novo modelo. A linguagem escolhida para o desenvolvimento do programa foi o Java, uma linguagem de programação informática desenvolvida no início dos anos 90. Esta linguagem surgiu como uma resposta à necessidade de uma linguagem mais simples do que a mais popular na altura – C++ – mas tão poderosa como esta. Trata-se de uma linguagem orientada por objetos (do inglês OOP object-oriented programming), usa o conceito de objetos que possuem atributos que descrevem o seu estado e procedimentos a si associados, os métodos, que, medeiam a interação entre objetos alterando o seu estado. É esta interação e os objetos que constituem um programa Java. No desenho do modelo foi utilizado como algoritmo iterador o algoritmo de Gillespie, publicado pela primeira vez em 1977 por Daniel Gillespie. Nesse artigo descreve a aplicação do algoritmo na simulação de sistemas de reações químicas com um poder computacional limitado. Este algoritmo, também referido como SSA (stochastic simulation algorithm) pode ser resumido em cinco passos: 1. Inicialização do tempo =0 e estado =0do sistema; 2. Avaliar todas as reações possíveis () e calcular a soma das suas constantes de velocidade 0(); 3. Gerar os valores de e ; 4. A reação ocorre pela atualização do tempo e do estado do sistema ; 5. Voltar ao passo 2 (ou terminar a simulação). O desenho do modelo tem em conta um grande conjunto de parâmetros e constantes biológicas cujos valores foram obtidos de várias publicações científicas referentes a trabalhos experimentais assim como de algumas publicações referentes a outros trabalhos de simulação/modelação. Tendo concluído a fase inicial do desenvolvimento do modelo procedeu-se à sua otimização que resultou numa redução do tempo de execução na ordem dos 250%. O modelo fornece um output personalizável que permite avaliar a quantidade de pré-mRNA, mRNA e proteína presentes no sistema ao longo do tempo de simulação. Este modelo pode ser aplicado a qualquer gene do código genético humano, variando os valores das constantes biológicas associadas a este. Da análise do output foi possível avaliar a resposta do modelo face a flutuações no valor dos parâmetros da iniciação da transcrição, degradação do RNA e degradação de proteína. É também possível comparar o grau da intensidade da resposta, pela comparação dos declives das regressões lineares, das simulações com 1 evento de splicing por mRNA face às simulações com sete locais. O modelo estocástico da expressão génica apresentado, embora seja relativamente intenso, permite a execução de simulações com aproximadamente 50 milhões de iterações correspondendo a um tempo de simulação de 15.000 segundos num período de tempo inferior a 120 minutos, havendo disponibilidade de processadores podem ser corridas várias simulações em simultâneo. Uma das vantagens da linguagem escolhida é a versatilidade que lhe permite que o modelo seja executado em qualquer sistema operativo. A inclusão dos eventos de splicing num modelo estocástico permitem dar um novo olhar sobre a análise do processo de expressão génica e a sua regulação.Pinto, Francisco RodriguesRepositório da Universidade de LisboaPenim, Flávia Alexandra Mendes2015-02-02T14:36:43Z201420142014-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/15849TID:201368030enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-11-20T17:21:38Zoai:repositorio.ul.pt:10451/15849Portal AgregadorONGhttps://www.rcaap.pt/oai/openairemluisa.alvim@gmail.comopendoar:71602024-11-20T17:21:38Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
A stochastic model of gene expression including splicing events |
title |
A stochastic model of gene expression including splicing events |
spellingShingle |
A stochastic model of gene expression including splicing events Penim, Flávia Alexandra Mendes Teses de mestrado - 2014 |
title_short |
A stochastic model of gene expression including splicing events |
title_full |
A stochastic model of gene expression including splicing events |
title_fullStr |
A stochastic model of gene expression including splicing events |
title_full_unstemmed |
A stochastic model of gene expression including splicing events |
title_sort |
A stochastic model of gene expression including splicing events |
author |
Penim, Flávia Alexandra Mendes |
author_facet |
Penim, Flávia Alexandra Mendes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pinto, Francisco Rodrigues Repositório da Universidade de Lisboa |
dc.contributor.author.fl_str_mv |
Penim, Flávia Alexandra Mendes |
dc.subject.por.fl_str_mv |
Teses de mestrado - 2014 |
topic |
Teses de mestrado - 2014 |
description |
Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2014 |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014 2014 2014-01-01T00:00:00Z 2015-02-02T14:36:43Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10451/15849 TID:201368030 |
url |
http://hdl.handle.net/10451/15849 |
identifier_str_mv |
TID:201368030 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
mluisa.alvim@gmail.com |
_version_ |
1817548840920678400 |