Transcriptograma em duas dimensões

Detalhes bibliográficos
Autor(a) principal: Perrone, Gabriel Cury
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/78437
Resumo: O conhecimento sobre o Genoma está crescendo rapidamente, assim como a quantidade de técnicas de medida da expressão gênica. É sabido que decodificar o DNA não é suficiente para entender o metabolismo celular e suas alterações, para isso, precisamos entender a expressão dos genes. Existem técnicas de medida de expressão de genoma completo, mas estas possuem ruído muito elevado, dificultando a análise dos seus resultados. Devido a isto, foram desenvolvidas técnicas para analisar estes resultados e aumentar a razão sinal-ruído; entre estas, temos o Transcriptograma. O Transcriptograma é dividido em duas etapas: o ordenamento de redes e o cálculo de médias. O ordenamento é feito por minimização de função custo, trata o Proteoma como uma rede simples e a ordena em uma lista utilizando o método de Monte Carlo para aproximar proteínas associadas. A partir da rede ordenada é possível analisar as propriedades desta, como a sua distribuição de módulos e de processos biológicos, e calcular o Transcriptograma através do cálculo das médias dos valores de expressão das proteínas dentro de uma vizinhança. Este método reduz o ruído das medidas de expressão gênica e possibilita a análise de performance celular, descrevendo o estado das células no momento da medida. Nesta dissertação, aprimoramos o método original de ordenamento alterando profundamente seu algoritmo. As modificações efetuadas reduziram em mais de mil vezes o tempo de execução do programa. As alterações obtidas abriram a possibilidade de ordenar a rede em uma dimensão qualquer, então produzimos um novo programa para obter o ordenamento da rede de proteínas em duas dimensões. Analisamos os novos resultados observando a distribuição dos módulos e de funções biológicas. A generalização do transcriptograma para duas dimensões mostra resultados melhores que os obtidos a partir do ordenamento em uma lista. Também propomos um método de seleção de amostras em duas classes e o aplicamos ao diagnóstico de Psoríase. Esse método separou claramente as amostras saudáveis das doentes. Com a rede ordenada,é possível analisar as regiões que mostram alterações no Transcriptograma e observar quais funções biológicas estão alteradas, obtendo mais informações sobre o estado celular e possibilitando a descoberta de novos alvos para fármacos.
id URGS_8e264a5bfa756ca665d016b6e9a8bd47
oai_identifier_str oai:www.lume.ufrgs.br:10183/78437
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Perrone, Gabriel CuryAlmeida, Rita Maria Cunha deBrunnet, Leonardo Gregory2013-09-28T01:51:17Z2013http://hdl.handle.net/10183/78437000899513O conhecimento sobre o Genoma está crescendo rapidamente, assim como a quantidade de técnicas de medida da expressão gênica. É sabido que decodificar o DNA não é suficiente para entender o metabolismo celular e suas alterações, para isso, precisamos entender a expressão dos genes. Existem técnicas de medida de expressão de genoma completo, mas estas possuem ruído muito elevado, dificultando a análise dos seus resultados. Devido a isto, foram desenvolvidas técnicas para analisar estes resultados e aumentar a razão sinal-ruído; entre estas, temos o Transcriptograma. O Transcriptograma é dividido em duas etapas: o ordenamento de redes e o cálculo de médias. O ordenamento é feito por minimização de função custo, trata o Proteoma como uma rede simples e a ordena em uma lista utilizando o método de Monte Carlo para aproximar proteínas associadas. A partir da rede ordenada é possível analisar as propriedades desta, como a sua distribuição de módulos e de processos biológicos, e calcular o Transcriptograma através do cálculo das médias dos valores de expressão das proteínas dentro de uma vizinhança. Este método reduz o ruído das medidas de expressão gênica e possibilita a análise de performance celular, descrevendo o estado das células no momento da medida. Nesta dissertação, aprimoramos o método original de ordenamento alterando profundamente seu algoritmo. As modificações efetuadas reduziram em mais de mil vezes o tempo de execução do programa. As alterações obtidas abriram a possibilidade de ordenar a rede em uma dimensão qualquer, então produzimos um novo programa para obter o ordenamento da rede de proteínas em duas dimensões. Analisamos os novos resultados observando a distribuição dos módulos e de funções biológicas. A generalização do transcriptograma para duas dimensões mostra resultados melhores que os obtidos a partir do ordenamento em uma lista. Também propomos um método de seleção de amostras em duas classes e o aplicamos ao diagnóstico de Psoríase. Esse método separou claramente as amostras saudáveis das doentes. Com a rede ordenada,é possível analisar as regiões que mostram alterações no Transcriptograma e observar quais funções biológicas estão alteradas, obtendo mais informações sobre o estado celular e possibilitando a descoberta de novos alvos para fármacos.Knowledge about the Genome is growing rapidly, as well as the number of techniques for measuring gene expression. It is known that decoding the DNA is not sufficient to understand cell metabolism and its alterations, for that we need to understand the expression of the genes. There are techniques for measuring expression of the complete genome, but these have very high noise, making it hard to analyze the results. Because of that, techniques were developed to analyze these results and increase the signal to noise ratio. Among these techniques there is the Transcriptogram. The Transcriptogram is divided into two stages: the ordering of networks and the calculation of the average of Transcriptomes. The ordering is made by minimizing a cost function, it treats the Proteome as a simple network and orders it in a list using the Monte Carlo method to make closer proteins that are associated. From the ordered network it is possible to analyze its properties, such as its modules and biological processes distribution, and calculate the Transcriptogram by calculating the mean value of protein expression in a neighborhood. This method reduces the noise of the measurements of gene expression and enables the analysis of cell performance, describing the state of the cells at the time of measurement. In this dissertation we improved the original ordering method making deep changes in its algorithm. These changes reduced the program execution time in more than one thousand times. These alterations openned the possibility of ordering the network in any dimension, then we produced a new programm to obtain the network ordering in two dimensions. We analyzed the new results by observing the modules and biological functions distribution. The generalization of the Transcriptogram to two dimensions shows better results than those obtained from the ordering in a list. We also propose a method for selecting samples into two classes and apply it to the diagnosis of Psoriasis. It clearly separated the samples from healthy patients. With the network ordered, we can analyze the regions that show alterations in the Transcriptogram and observe which biological functions are altered, obtaining more information about cell state and enabling the discovery of new targets for drugs.application/pdfporMetabolismo celularExpressão gênicaRedesMétodo de Monte CarloBiofísicaTranscriptogramaTranscriptograma em duas dimensõesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de FísicaPrograma de Pós-Graduação em FísicaPorto Alegre, BR-RS2013mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000899513.pdf.txt000899513.pdf.txtExtracted Texttext/plain100845http://www.lume.ufrgs.br/bitstream/10183/78437/2/000899513.pdf.txt50377ffd174b66f4f337a12838fd0402MD52ORIGINAL000899513.pdf000899513.pdfTexto completoapplication/pdf6168183http://www.lume.ufrgs.br/bitstream/10183/78437/1/000899513.pdff268ab99c15042cb9c98935a24f1f0f0MD51THUMBNAIL000899513.pdf.jpg000899513.pdf.jpgGenerated Thumbnailimage/jpeg947http://www.lume.ufrgs.br/bitstream/10183/78437/3/000899513.pdf.jpged313de2240daab993ef7bd62138f2b4MD5310183/784372022-06-15 04:44:12.700733oai:www.lume.ufrgs.br:10183/78437Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-06-15T07:44:12Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Transcriptograma em duas dimensões
title Transcriptograma em duas dimensões
spellingShingle Transcriptograma em duas dimensões
Perrone, Gabriel Cury
Metabolismo celular
Expressão gênica
Redes
Método de Monte Carlo
Biofísica
Transcriptograma
title_short Transcriptograma em duas dimensões
title_full Transcriptograma em duas dimensões
title_fullStr Transcriptograma em duas dimensões
title_full_unstemmed Transcriptograma em duas dimensões
title_sort Transcriptograma em duas dimensões
author Perrone, Gabriel Cury
author_facet Perrone, Gabriel Cury
author_role author
dc.contributor.author.fl_str_mv Perrone, Gabriel Cury
dc.contributor.advisor1.fl_str_mv Almeida, Rita Maria Cunha de
dc.contributor.advisor-co1.fl_str_mv Brunnet, Leonardo Gregory
contributor_str_mv Almeida, Rita Maria Cunha de
Brunnet, Leonardo Gregory
dc.subject.por.fl_str_mv Metabolismo celular
Expressão gênica
Redes
Método de Monte Carlo
Biofísica
Transcriptograma
topic Metabolismo celular
Expressão gênica
Redes
Método de Monte Carlo
Biofísica
Transcriptograma
description O conhecimento sobre o Genoma está crescendo rapidamente, assim como a quantidade de técnicas de medida da expressão gênica. É sabido que decodificar o DNA não é suficiente para entender o metabolismo celular e suas alterações, para isso, precisamos entender a expressão dos genes. Existem técnicas de medida de expressão de genoma completo, mas estas possuem ruído muito elevado, dificultando a análise dos seus resultados. Devido a isto, foram desenvolvidas técnicas para analisar estes resultados e aumentar a razão sinal-ruído; entre estas, temos o Transcriptograma. O Transcriptograma é dividido em duas etapas: o ordenamento de redes e o cálculo de médias. O ordenamento é feito por minimização de função custo, trata o Proteoma como uma rede simples e a ordena em uma lista utilizando o método de Monte Carlo para aproximar proteínas associadas. A partir da rede ordenada é possível analisar as propriedades desta, como a sua distribuição de módulos e de processos biológicos, e calcular o Transcriptograma através do cálculo das médias dos valores de expressão das proteínas dentro de uma vizinhança. Este método reduz o ruído das medidas de expressão gênica e possibilita a análise de performance celular, descrevendo o estado das células no momento da medida. Nesta dissertação, aprimoramos o método original de ordenamento alterando profundamente seu algoritmo. As modificações efetuadas reduziram em mais de mil vezes o tempo de execução do programa. As alterações obtidas abriram a possibilidade de ordenar a rede em uma dimensão qualquer, então produzimos um novo programa para obter o ordenamento da rede de proteínas em duas dimensões. Analisamos os novos resultados observando a distribuição dos módulos e de funções biológicas. A generalização do transcriptograma para duas dimensões mostra resultados melhores que os obtidos a partir do ordenamento em uma lista. Também propomos um método de seleção de amostras em duas classes e o aplicamos ao diagnóstico de Psoríase. Esse método separou claramente as amostras saudáveis das doentes. Com a rede ordenada,é possível analisar as regiões que mostram alterações no Transcriptograma e observar quais funções biológicas estão alteradas, obtendo mais informações sobre o estado celular e possibilitando a descoberta de novos alvos para fármacos.
publishDate 2013
dc.date.accessioned.fl_str_mv 2013-09-28T01:51:17Z
dc.date.issued.fl_str_mv 2013
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/78437
dc.identifier.nrb.pt_BR.fl_str_mv 000899513
url http://hdl.handle.net/10183/78437
identifier_str_mv 000899513
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/78437/2/000899513.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/78437/1/000899513.pdf
http://www.lume.ufrgs.br/bitstream/10183/78437/3/000899513.pdf.jpg
bitstream.checksum.fl_str_mv 50377ffd174b66f4f337a12838fd0402
f268ab99c15042cb9c98935a24f1f0f0
ed313de2240daab993ef7bd62138f2b4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1800309038608547840