Métodos estatísticos aplicados à análise da expressão gênica
Autor(a) principal: | |
---|---|
Data de Publicação: | 2006 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSCAR |
Texto Completo: | https://repositorio.ufscar.br/handle/ufscar/4596 |
Resumo: | The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression. |
id |
SCAR_f8c16cfd2de2d4bce6dba7c7b83c1d8d |
---|---|
oai_identifier_str |
oai:repositorio.ufscar.br:ufscar/4596 |
network_acronym_str |
SCAR |
network_name_str |
Repositório Institucional da UFSCAR |
repository_id_str |
4322 |
spelling |
Saraiva, Erlandson FerreiraMilan, Luis Aparecido78d3f62d-90b4-4fe7-9d21-ed78d7dab9d32016-06-02T20:06:11Z2007-10-192016-06-02T20:06:11Z2006-02-23https://repositorio.ufscar.br/handle/ufscar/4596The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression.A tecnologia dos arranjos de DNA (DNA-array) é uma ferramenta utilizada para identificar e comparar níveis de expressão de um grande número de genes ou fragmentos de genes simultaneamente, em condições diferentes. Com esta comparação, é possível determinar possíveis genes causadores de doenças de origem genética (por exemplo, o câncer). Nestes experimentos, grandes quantidades de dados numéricos (relacionados às medidas de níveis de expressão dos genes) são gerados e métodos estatísticos são im- portantes para análise dos dados, com objetivo de identificar os genes que apresentam evidências para níveis de expressão diferentes. O objetivo de nossa pesquisa é comparar o desempenho e desenvolver métodos estatísticos, capazes de identificar genes que apresentam evidências para níveis de expressão diferentes, quando comparamos situações de interesse (tratamentos) com uma situação de controle. Para isto, descrevemos o teste t, proposto por Baldi e Long (2001) e propomos três métodos para identificar genes com evidências para níveis de expressão diferentes. O primeiro método proposto é baseado na utilização da inferência bayesiana paramétrica e dos métodos de seleção de modelos, fator de Bayes e DIC; o segundo método é baseado na inferência bayesiana semi-paramétrica conhecida como modelo de misturas de processos Dirichlet; e o terceiro método é baseado na utilização de um modelo com mistura infinita de distribuições, que aplicado à análise da expressão gênica determina grupos de níveis de expressão gênica similares, baseados nos efeitos de tratamento.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatística matemáticaExpressão gênicaInferência bayesianaSeleção de modelosProcessos de DirichletArranjos de DNATeste tModelo com mistura de distribuiçõesInferência bayesiana não paramétricaCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAMétodos estatísticos aplicados à análise da expressão gênicainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-1-101874dfd-bd1b-409c-81e8-3185c83eacf2info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissEFS.pdfapplication/pdf1135537https://repositorio.ufscar.br/bitstream/ufscar/4596/1/DissEFS.pdfb92ac0d09924bd51723ad77018da04deMD51THUMBNAILDissEFS.pdf.jpgDissEFS.pdf.jpgIM Thumbnailimage/jpeg6391https://repositorio.ufscar.br/bitstream/ufscar/4596/2/DissEFS.pdf.jpgf35202c4ea2f41880640079df86f7ceaMD52ufscar/45962023-09-18 18:31:03.141oai:repositorio.ufscar.br:ufscar/4596Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:03Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
dc.title.por.fl_str_mv |
Métodos estatísticos aplicados à análise da expressão gênica |
title |
Métodos estatísticos aplicados à análise da expressão gênica |
spellingShingle |
Métodos estatísticos aplicados à análise da expressão gênica Saraiva, Erlandson Ferreira Estatística matemática Expressão gênica Inferência bayesiana Seleção de modelos Processos de Dirichlet Arranjos de DNA Teste t Modelo com mistura de distribuições Inferência bayesiana não paramétrica CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
title_short |
Métodos estatísticos aplicados à análise da expressão gênica |
title_full |
Métodos estatísticos aplicados à análise da expressão gênica |
title_fullStr |
Métodos estatísticos aplicados à análise da expressão gênica |
title_full_unstemmed |
Métodos estatísticos aplicados à análise da expressão gênica |
title_sort |
Métodos estatísticos aplicados à análise da expressão gênica |
author |
Saraiva, Erlandson Ferreira |
author_facet |
Saraiva, Erlandson Ferreira |
author_role |
author |
dc.contributor.author.fl_str_mv |
Saraiva, Erlandson Ferreira |
dc.contributor.advisor1.fl_str_mv |
Milan, Luis Aparecido |
dc.contributor.authorID.fl_str_mv |
78d3f62d-90b4-4fe7-9d21-ed78d7dab9d3 |
contributor_str_mv |
Milan, Luis Aparecido |
dc.subject.por.fl_str_mv |
Estatística matemática Expressão gênica Inferência bayesiana Seleção de modelos Processos de Dirichlet Arranjos de DNA Teste t Modelo com mistura de distribuições Inferência bayesiana não paramétrica |
topic |
Estatística matemática Expressão gênica Inferência bayesiana Seleção de modelos Processos de Dirichlet Arranjos de DNA Teste t Modelo com mistura de distribuições Inferência bayesiana não paramétrica CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA |
description |
The technology of the DNA-Arrays is a tool used to identify and to compare levels of expression of a great number of genes or fragments of genes, in di¤erent conditions. With this comparison, it is possible to identify genes possibly causing illnesses of genetic origin (cancer for example). Great amounts of numerical data (related the measures of levels of expression of the genes) are generated and statistical methods are important for analysis of this data with objective to identify the genes that present evidences for di¤erent levels of expression. The objective of our research is to develop and to describe methods statistical, capable of identifing genes that present evidences for di¤erent levels of expression. We describe the test t, considered for Baldi and Long (2001) and consider three others methods. The first method considered is based on the use of parametric Bayes inference and the methods for selection of models, Bayes factor and DIC; the second method is based an semi-parametric bayesian inference, model of mixtures of Dirichlet processes. The third method is based on the use of a model with infinite mixtures of distributions that applied the analysis of the genica expression determines groups of similar levels of expression. |
publishDate |
2006 |
dc.date.issued.fl_str_mv |
2006-02-23 |
dc.date.available.fl_str_mv |
2007-10-19 2016-06-02T20:06:11Z |
dc.date.accessioned.fl_str_mv |
2016-06-02T20:06:11Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/ufscar/4596 |
url |
https://repositorio.ufscar.br/handle/ufscar/4596 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.confidence.fl_str_mv |
-1 -1 |
dc.relation.authority.fl_str_mv |
01874dfd-bd1b-409c-81e8-3185c83eacf2 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística - PPGEs |
dc.publisher.initials.fl_str_mv |
UFSCar |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
Universidade Federal de São Carlos |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
instname_str |
Universidade Federal de São Carlos (UFSCAR) |
instacron_str |
UFSCAR |
institution |
UFSCAR |
reponame_str |
Repositório Institucional da UFSCAR |
collection |
Repositório Institucional da UFSCAR |
bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstream/ufscar/4596/1/DissEFS.pdf https://repositorio.ufscar.br/bitstream/ufscar/4596/2/DissEFS.pdf.jpg |
bitstream.checksum.fl_str_mv |
b92ac0d09924bd51723ad77018da04de f35202c4ea2f41880640079df86f7cea |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
repository.mail.fl_str_mv |
|
_version_ |
1802136277508685824 |