Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/15849
Título: A stochastic model of gene expression including splicing events
Autor: Penim, Flávia Alexandra Mendes
Orientador: Pinto, Francisco Rodrigues
Palavras-chave: Teses de mestrado - 2014
Data de Defesa: 2014
Resumo: Proteins carry out the great majority of the catalytic and structural work within an organism. The RNA templates used in their synthesis determines their identity, and this is dictated by which genes are transcribed. Therefore, gene expression is the fundamental determinant of an organism’s nature. The main objective of this thesis was to develop a stochastic computational model able to simulate the gene expression phenomena to best evaluate its critical points including the process of splicing. With this aim, an extended research was performed looking for already described similar models, identifying their strengths and weaknesses, approaches, languages and algorithms used. Here we present a model developed in Java, which is an object-oriented language or object-oriented programming (OOP) implementing the Gillespie’s algorithm. The model receives as input an array of 19 biological parameters. Although at first the model was time consuming and intense, it was optimized reducing the simulation time in approximately 250%. With this model we wish to take a closer look at the regulation of gene expression, evaluating it with greater accuracy. For that purpose we varied the values of the transcription initiation, RNA degradation and protein degradation rate constants. The results evidenced that the transcription initiation and RNA degradation present the same level of control towards the influence of pre-mRNA, mRNA and protein numbers; in terms of protein numbers, their influence is lower when compared with the protein degradation constant (which has no influence on RNAs numbers).
A informação genética de cada indivíduo está guardada no seu DNA, uma biomolécula de armazenamento muito estável, de forma a garantir a integridade dos genes de cada um. Contudo sendo muito estável e imutável também torna muito difícil o acesso à informação que contém. É necessário transcrever essa informação para um outro tipo de molécula mais ativa. É este o conceito por detrás da expressão génica. A expressão génica pode ser resumida em dois passos fundamentais: a transcrição e a tradução. O primeiro é a etapa durante a qual o RNA mensageiro (mRNA) é produzido de acordo com o gene que serve como molde. No passo seguinte o mRNA vai servir de base para que o seu conteúdo seja traduzido pelos ribossomas para uma nova molécula, a proteína. As proteínas desempenham a grande maioria das funções catalíticas necessárias a um organismo. O RNA, utilizado como base para a sua síntese, determina a sua identidade e esta é ditada pelo gene que anteriormente serviu de molde à sua produção. Assim, não é de admirar que o processo de expressão génica seja tão importante como crítico. Defeitos ou anomalias ao nível da transcrição são responsáveis pela origem de grande parte das doenças que afetam a espécie humana. A maioria dos genes eucariotas (e alguns procariotas) são expressos como um precursor do mRNA que é editado e transformado na forma madura do mRNA. A este processo dá-se o nome de splicing, este passo também essencial é o momento em que porções não codificantes presentes no pré-mRNA (intrões de região intragénica) são removidas e as regiões codificantes (exões) são unidas dando origem ao mRNA. A expressão génica é em si um processo denominado estocástico. A palavra ‘estocástico’ significa ‘aleatório’ do grego 𝜎𝜏`𝜒𝑜𝑠 que significa ‘adivinhar’. Os genes são ativados por associações e dissociações aleatórias, a transcrição é tipicamente rara e muitas proteínas são expressas em baixa quantidade por célula. Ao nível celular, a dinâmica química é frequentemente determinada pela ação de apenas um punhado de moléculas, consequentemente flutuações ao nível molecular podem controlar a dinâmica da célula. Em teoria probabilística um processo estocástico, ou aleatório, é descrito como um conjunto de variáveis aleatórias. Contrariamente ao processo determinístico, ao invés de descrever um processo de uma forma que terá apenas um resultado possível, como por exemplo a resolução de equações diferenciais ordinárias, num processo estocástico há um certo grau de indeterminação. Mesmo quando o ponto de início da simulação é conhecido há vários caminhos pelos quais a simulação pode evoluir. De um ponto de vista bioinformático a abordagem por nós seguida, e que culminou no trabalho desta tese, teve como principal objetivo desenvolver um modelo informático de simulação estocástica do processo de transcrição e tradução génica incluindo o fenómeno de splicing no processo de maturação dos pré-mRNAs em mRNA maduros. Com o desenvolvimento deste programa é pretendido que seja melhor possível avaliar/identificar os locais de maior impacto e, por consequência, controlo destes, de todo o decorrer da expressão génica. Neste sentido foi feita uma extensa pesquisa bibliográfica, tentando identificar modelos já existentes reconhecendo tanto as suas mais-valias como as desvantagens, formas de abordagem ao problema, linguagem, algoritmos de iteração usados e conclusões obtidas. Com a informação recolhida foi por nós desenhado um novo modelo. A linguagem escolhida para o desenvolvimento do programa foi o Java, uma linguagem de programação informática desenvolvida no início dos anos 90. Esta linguagem surgiu como uma resposta à necessidade de uma linguagem mais simples do que a mais popular na altura – C++ – mas tão poderosa como esta. Trata-se de uma linguagem orientada por objetos (do inglês OOP object-oriented programming), usa o conceito de objetos que possuem atributos que descrevem o seu estado e procedimentos a si associados, os métodos, que, medeiam a interação entre objetos alterando o seu estado. É esta interação e os objetos que constituem um programa Java. No desenho do modelo foi utilizado como algoritmo iterador o algoritmo de Gillespie, publicado pela primeira vez em 1977 por Daniel Gillespie. Nesse artigo descreve a aplicação do algoritmo na simulação de sistemas de reações químicas com um poder computacional limitado. Este algoritmo, também referido como SSA (stochastic simulation algorithm) pode ser resumido em cinco passos: 1. Inicialização do tempo 𝑡=𝑡0 e estado 𝑥=𝑥0do sistema; 2. Avaliar todas as reações possíveis 𝑎𝑗(𝑥) e calcular a soma das suas constantes de velocidade 𝑎0(𝑥); 3. Gerar os valores de 𝜏 e 𝑗; 4. A reação 𝑅𝑗 ocorre pela atualização do tempo 𝑡 e do estado do sistema 𝑥; 5. Voltar ao passo 2 (ou terminar a simulação). O desenho do modelo tem em conta um grande conjunto de parâmetros e constantes biológicas cujos valores foram obtidos de várias publicações científicas referentes a trabalhos experimentais assim como de algumas publicações referentes a outros trabalhos de simulação/modelação. Tendo concluído a fase inicial do desenvolvimento do modelo procedeu-se à sua otimização que resultou numa redução do tempo de execução na ordem dos 250%. O modelo fornece um output personalizável que permite avaliar a quantidade de pré-mRNA, mRNA e proteína presentes no sistema ao longo do tempo de simulação. Este modelo pode ser aplicado a qualquer gene do código genético humano, variando os valores das constantes biológicas associadas a este. Da análise do output foi possível avaliar a resposta do modelo face a flutuações no valor dos parâmetros da iniciação da transcrição, degradação do RNA e degradação de proteína. É também possível comparar o grau da intensidade da resposta, pela comparação dos declives das regressões lineares, das simulações com 1 evento de splicing por mRNA face às simulações com sete locais. O modelo estocástico da expressão génica apresentado, embora seja relativamente intenso, permite a execução de simulações com aproximadamente 50 milhões de iterações correspondendo a um tempo de simulação de 15.000 segundos num período de tempo inferior a 120 minutos, havendo disponibilidade de processadores podem ser corridas várias simulações em simultâneo. Uma das vantagens da linguagem escolhida é a versatilidade que lhe permite que o modelo seja executado em qualquer sistema operativo. A inclusão dos eventos de splicing num modelo estocástico permitem dar um novo olhar sobre a análise do processo de expressão génica e a sua regulação.
Descrição: Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2014
URI: http://hdl.handle.net/10451/15849
Designação: Mestrado em Bioinformática e Biologia Computacional
Aparece nas colecções:FC-DI - Master Thesis (dissertation)

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
ulfc112323_tm_Flávia_Penim.pdf1,94 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.