Metodologias estatísticas para análise de níveis de expressão genética
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10773/10553 |
Resumo: | A tecnologia de microarrays de DNA permite monitorizar a expressão de milhares de genes em simultâneo, constituindo um instrumento de grande apoia a investigação de grandes questões nas áreas da Biologia Molecular, Genética, Medicina, entre outras. O uso de ferramentas estatisticas que permitam a deteção de genes diferencialmente expressos torna-se imprescindível no sentido de fornecer ao biólogo a identificação de diferenças entre as várias amostras comparadas durante a experiencia de microarrays. Nesta dissertação serão abordadas diferentes metodologias estatísticas com vista a deteção de genes que evidenciam diferenças significativas nos níveis de expressão sob duas condições distintas. Concretamente, estuda-se o procedimento estatístico de Analise de Significância de Mi- croarrays (SAM) e vários métodos de Bayes empíricos. A metodologia SAM permite estabelecer a partir do valor observado de uma estatística de teste para cada gene, usando o método das permutações e controlando a taxa de falsas descobertas, quais os genes com níveis de expressão ao significativamente diferentes. Os métodos de Bayes empíricos assumem o ajustamento dos níveis de expressão genética a um dado modelo probabilístico teórico o qual, por sua vez, depende de uma distribuição a priori para o modelo dos parâmetros, sendo que os parâmetros da distribuição a priori são estimados com base nos dados observados. No presente trabalho serão abordadas quatro metodologias inseridas nos métodos de Bayes empíricos: um modelo linear e os modelos Gamma-Gamma, Log-Normal-Normal e Log-Normal-Normal com Variância Modificada. Com o auxílio de packages do R obtidos do Bioconductor (nomeadamente, limma e EBarrays) e do package do R samr, aplicaram-se as metodologias referidas a duas bases de dados reais designadas por ApoAI e Fermentation. A ApoAI visa o estudo de ratos cujo gene ApoAI não esta funcional e a forma como a de ciência deste gene afeta o desempenho dos outros genes no fígado. A base de dados Fermentation resulta de uma experiencia de duas cores de microar- rays de DNA recentemente realizada no Laboratório de Microarrays da Universidade de Aveiro. A análise destes dados visa comparar os níveis de expressão genética de cinco leveduras vínicas e duas leveduras não vínicas e identificar genes que permitam distinguir estirpes com uma boa resistência ao stress imposto pelo processo de fermentação. Os resultados obtidos com cada uma das metodologias foram analisados e comparados obtendo-se uma lista de genes comuns identificados por todas as metodologias. |
id |
RCAP_920f0d182fa8aec4670281d9a16ee2a3 |
---|---|
oai_identifier_str |
oai:ria.ua.pt:10773/10553 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Metodologias estatísticas para análise de níveis de expressão genéticaMatemática aplicadaExpressão genéticaMicromatrizes de ADNA - nálise de dadosMétodos estatísticosA tecnologia de microarrays de DNA permite monitorizar a expressão de milhares de genes em simultâneo, constituindo um instrumento de grande apoia a investigação de grandes questões nas áreas da Biologia Molecular, Genética, Medicina, entre outras. O uso de ferramentas estatisticas que permitam a deteção de genes diferencialmente expressos torna-se imprescindível no sentido de fornecer ao biólogo a identificação de diferenças entre as várias amostras comparadas durante a experiencia de microarrays. Nesta dissertação serão abordadas diferentes metodologias estatísticas com vista a deteção de genes que evidenciam diferenças significativas nos níveis de expressão sob duas condições distintas. Concretamente, estuda-se o procedimento estatístico de Analise de Significância de Mi- croarrays (SAM) e vários métodos de Bayes empíricos. A metodologia SAM permite estabelecer a partir do valor observado de uma estatística de teste para cada gene, usando o método das permutações e controlando a taxa de falsas descobertas, quais os genes com níveis de expressão ao significativamente diferentes. Os métodos de Bayes empíricos assumem o ajustamento dos níveis de expressão genética a um dado modelo probabilístico teórico o qual, por sua vez, depende de uma distribuição a priori para o modelo dos parâmetros, sendo que os parâmetros da distribuição a priori são estimados com base nos dados observados. No presente trabalho serão abordadas quatro metodologias inseridas nos métodos de Bayes empíricos: um modelo linear e os modelos Gamma-Gamma, Log-Normal-Normal e Log-Normal-Normal com Variância Modificada. Com o auxílio de packages do R obtidos do Bioconductor (nomeadamente, limma e EBarrays) e do package do R samr, aplicaram-se as metodologias referidas a duas bases de dados reais designadas por ApoAI e Fermentation. A ApoAI visa o estudo de ratos cujo gene ApoAI não esta funcional e a forma como a de ciência deste gene afeta o desempenho dos outros genes no fígado. A base de dados Fermentation resulta de uma experiencia de duas cores de microar- rays de DNA recentemente realizada no Laboratório de Microarrays da Universidade de Aveiro. A análise destes dados visa comparar os níveis de expressão genética de cinco leveduras vínicas e duas leveduras não vínicas e identificar genes que permitam distinguir estirpes com uma boa resistência ao stress imposto pelo processo de fermentação. Os resultados obtidos com cada uma das metodologias foram analisados e comparados obtendo-se uma lista de genes comuns identificados por todas as metodologias.The technology of DNA microarrays allows the monitoring of the expression levels of thousands of genes simultaneously in a single experiment. It has become a useful tool to support research in the elds of Molecular Biology, Genetics and Medicine, helping scientists to understand the patterns of gene activity in di erent cellular conditions. In the eld of Statistics, the large amount of complex data emerging from DNA microarray technologies has created new challenges and stimulated the development of new methods. In this dissertation, di erent statistical methodologies developed for the detection of di erentially expressed genes in microarray experiments were studied and applied on two experimental datasets. These methodologies were, speci cally, Signi cance Analysis of Microarrays (SAM) and various procedures based on empirical Bayes methods. The SAM procedure is a permutation-based statistical technique which considers gene speci c statistical tests and measures the strength of the relationship between gene expression and condition types in order to decide whether there are statistically signi cant di erences in gene expression levels, controlling the false discovery rate. Empirical Bayes procedures are bayesian methodologies in which the prior distribution for the model parameters is estimated from the data. Herein, four different theoretical models for the expression levels were included in the empirical Bayes approach: linear model, Log-Normal-Normal model, Gamma-Gamma model and, nally, the Log-Normal-Normal with modi ed variance model. Using R packages (namely, samr and both limma and EBarrays from Bioconductor), those methodologies were applied on two real databases designated ApoAI and Fermentation. The ApoAI database has been largely studied in the specialized literature and it is aimed at identifying genes with altered expression in mice whose Apo AI gene is not functional. The Fermentation database was recently obtained at the National Facility for DNA Microarray at the University of Aveiro, and it comes from two colour DNA microarray experiment carried out to distinguish yeast strains with good resistance to stress imposed by the fermentation process. The results generated with each methodology for each database were analyzed and compared to obtain a list of di erentially expressed genes commonly identi ed by methodologies applied.Universidade de Aveiro2013-05-31T14:48:15Z2010-01-01T00:00:00Z2010info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/10553porRoque, Sara Leitãoinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T11:18:30Zoai:ria.ua.pt:10773/10553Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:47:07.478561Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Metodologias estatísticas para análise de níveis de expressão genética |
title |
Metodologias estatísticas para análise de níveis de expressão genética |
spellingShingle |
Metodologias estatísticas para análise de níveis de expressão genética Roque, Sara Leitão Matemática aplicada Expressão genética Micromatrizes de ADNA - nálise de dados Métodos estatísticos |
title_short |
Metodologias estatísticas para análise de níveis de expressão genética |
title_full |
Metodologias estatísticas para análise de níveis de expressão genética |
title_fullStr |
Metodologias estatísticas para análise de níveis de expressão genética |
title_full_unstemmed |
Metodologias estatísticas para análise de níveis de expressão genética |
title_sort |
Metodologias estatísticas para análise de níveis de expressão genética |
author |
Roque, Sara Leitão |
author_facet |
Roque, Sara Leitão |
author_role |
author |
dc.contributor.author.fl_str_mv |
Roque, Sara Leitão |
dc.subject.por.fl_str_mv |
Matemática aplicada Expressão genética Micromatrizes de ADNA - nálise de dados Métodos estatísticos |
topic |
Matemática aplicada Expressão genética Micromatrizes de ADNA - nálise de dados Métodos estatísticos |
description |
A tecnologia de microarrays de DNA permite monitorizar a expressão de milhares de genes em simultâneo, constituindo um instrumento de grande apoia a investigação de grandes questões nas áreas da Biologia Molecular, Genética, Medicina, entre outras. O uso de ferramentas estatisticas que permitam a deteção de genes diferencialmente expressos torna-se imprescindível no sentido de fornecer ao biólogo a identificação de diferenças entre as várias amostras comparadas durante a experiencia de microarrays. Nesta dissertação serão abordadas diferentes metodologias estatísticas com vista a deteção de genes que evidenciam diferenças significativas nos níveis de expressão sob duas condições distintas. Concretamente, estuda-se o procedimento estatístico de Analise de Significância de Mi- croarrays (SAM) e vários métodos de Bayes empíricos. A metodologia SAM permite estabelecer a partir do valor observado de uma estatística de teste para cada gene, usando o método das permutações e controlando a taxa de falsas descobertas, quais os genes com níveis de expressão ao significativamente diferentes. Os métodos de Bayes empíricos assumem o ajustamento dos níveis de expressão genética a um dado modelo probabilístico teórico o qual, por sua vez, depende de uma distribuição a priori para o modelo dos parâmetros, sendo que os parâmetros da distribuição a priori são estimados com base nos dados observados. No presente trabalho serão abordadas quatro metodologias inseridas nos métodos de Bayes empíricos: um modelo linear e os modelos Gamma-Gamma, Log-Normal-Normal e Log-Normal-Normal com Variância Modificada. Com o auxílio de packages do R obtidos do Bioconductor (nomeadamente, limma e EBarrays) e do package do R samr, aplicaram-se as metodologias referidas a duas bases de dados reais designadas por ApoAI e Fermentation. A ApoAI visa o estudo de ratos cujo gene ApoAI não esta funcional e a forma como a de ciência deste gene afeta o desempenho dos outros genes no fígado. A base de dados Fermentation resulta de uma experiencia de duas cores de microar- rays de DNA recentemente realizada no Laboratório de Microarrays da Universidade de Aveiro. A análise destes dados visa comparar os níveis de expressão genética de cinco leveduras vínicas e duas leveduras não vínicas e identificar genes que permitam distinguir estirpes com uma boa resistência ao stress imposto pelo processo de fermentação. Os resultados obtidos com cada uma das metodologias foram analisados e comparados obtendo-se uma lista de genes comuns identificados por todas as metodologias. |
publishDate |
2010 |
dc.date.none.fl_str_mv |
2010-01-01T00:00:00Z 2010 2013-05-31T14:48:15Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10773/10553 |
url |
http://hdl.handle.net/10773/10553 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade de Aveiro |
publisher.none.fl_str_mv |
Universidade de Aveiro |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137522367856640 |