Métodos estatísticos aplicados à análise da expressão gênica

Detalhes bibliográficos
Autor(a) principal: Saraiva, Erlandson Ferreira
Data de Publicação: 2006
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFSCAR
Texto Completo: https://repositorio.ufscar.br/handle/ufscar/4596
Resumo: The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.
id SCAR_f8c16cfd2de2d4bce6dba7c7b83c1d8d
oai_identifier_str oai:repositorio.ufscar.br:ufscar/4596
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str 4322
spelling Saraiva, Erlandson FerreiraMilan, Luis Aparecido78d3f62d-90b4-4fe7-9d21-ed78d7dab9d32016-06-02T20:06:11Z2007-10-192016-06-02T20:06:11Z2006-02-23https://repositorio.ufscar.br/handle/ufscar/4596The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.A tecnologia dos arranjos de DNA (DNA-array) é uma ferramenta utilizada para identificar e comparar níveis de expressão de um grande número de genes ou fragmentos de genes simultaneamente, em condições diferentes. Com esta comparação, é possível determinar possíveis genes causadores de doenças de origem genética (por exemplo, o câncer). Nestes experimentos, grandes quantidades de dados numéricos (relacionados às medidas de níveis de expressão dos genes) são gerados e métodos estatísticos são im- portantes para análise dos dados, com objetivo de identificar os genes que apresentam evidências para níveis de expressão diferentes. O objetivo de nossa pesquisa é comparar o desempenho e desenvolver métodos estatísticos, capazes de identificar genes que apresentam evidências para níveis de expressão diferentes, quando comparamos situações de interesse (tratamentos) com uma situação de controle. Para isto, descrevemos o teste t, proposto por Baldi e Long (2001) e propomos três métodos para identificar genes com evidências para níveis de expressão diferentes. O primeiro método proposto é baseado na utilização da inferência bayesiana paramétrica e dos métodos de seleção de modelos, fator de Bayes e DIC; o segundo método é baseado na inferência bayesiana semi-paramétrica conhecida como modelo de misturas de processos Dirichlet; e o terceiro método é baseado na utilização de um modelo com mistura infinita de distribuições, que aplicado à análise da expressão gênica determina grupos de níveis de expressão gênica similares, baseados nos efeitos de tratamento.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatística matemáticaExpressão gênicaInferência bayesianaSeleção de modelosProcessos de DirichletArranjos de DNATeste tModelo com mistura de distribuiçõesInferência bayesiana não paramétricaCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAMétodos estatísticos aplicados à análise da expressão gênicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-101874dfd-bd1b-409c-81e8-3185c83eacf2info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissEFS.pdfapplication/pdf1135537https://repositorio.ufscar.br/bitstream/ufscar/4596/1/DissEFS.pdfb92ac0d09924bd51723ad77018da04deMD51THUMBNAILDissEFS.pdf.jpgDissEFS.pdf.jpgIM Thumbnailimage/jpeg6391https://repositorio.ufscar.br/bitstream/ufscar/4596/2/DissEFS.pdf.jpgf35202c4ea2f41880640079df86f7ceaMD52ufscar/45962023-09-18 18:31:03.141oai:repositorio.ufscar.br:ufscar/4596Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:03Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Métodos estatísticos aplicados à análise da expressão gênica
title Métodos estatísticos aplicados à análise da expressão gênica
spellingShingle Métodos estatísticos aplicados à análise da expressão gênica
Saraiva, Erlandson Ferreira
Estatística matemática
Expressão gênica
Inferência bayesiana
Seleção de modelos
Processos de Dirichlet
Arranjos de DNA
Teste t
Modelo com mistura de distribuições
Inferência bayesiana não paramétrica
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Métodos estatísticos aplicados à análise da expressão gênica
title_full Métodos estatísticos aplicados à análise da expressão gênica
title_fullStr Métodos estatísticos aplicados à análise da expressão gênica
title_full_unstemmed Métodos estatísticos aplicados à análise da expressão gênica
title_sort Métodos estatísticos aplicados à análise da expressão gênica
author Saraiva, Erlandson Ferreira
author_facet Saraiva, Erlandson Ferreira
author_role author
dc.contributor.author.fl_str_mv Saraiva, Erlandson Ferreira
dc.contributor.advisor1.fl_str_mv Milan, Luis Aparecido
dc.contributor.authorID.fl_str_mv 78d3f62d-90b4-4fe7-9d21-ed78d7dab9d3
contributor_str_mv Milan, Luis Aparecido
dc.subject.por.fl_str_mv Estatística matemática
Expressão gênica
Inferência bayesiana
Seleção de modelos
Processos de Dirichlet
Arranjos de DNA
Teste t
Modelo com mistura de distribuições
Inferência bayesiana não paramétrica
topic Estatística matemática
Expressão gênica
Inferência bayesiana
Seleção de modelos
Processos de Dirichlet
Arranjos de DNA
Teste t
Modelo com mistura de distribuições
Inferência bayesiana não paramétrica
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.
publishDate 2006
dc.date.issued.fl_str_mv 2006-02-23
dc.date.available.fl_str_mv 2007-10-19
2016-06-02T20:06:11Z
dc.date.accessioned.fl_str_mv 2016-06-02T20:06:11Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/4596
url https://repositorio.ufscar.br/handle/ufscar/4596
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 01874dfd-bd1b-409c-81e8-3185c83eacf2
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística - PPGEs
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/4596/1/DissEFS.pdf
https://repositorio.ufscar.br/bitstream/ufscar/4596/2/DissEFS.pdf.jpg
bitstream.checksum.fl_str_mv b92ac0d09924bd51723ad77018da04de
f35202c4ea2f41880640079df86f7cea
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136277508685824