Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | LOCUS Repositório Institucional da UFV |
Texto Completo: | http://locus.ufv.br/handle/123456789/4066 |
Resumo: | One of the current objectives of molecular biology is to measure and assess the gene expression profiles in different types of biological tissues, to understand the mechanisms of molecular transformation under certain conditions. Next-generation sequencing (NGS) technologies promote DNA sequencing in platforms capable of generating information about millions of base pairs in a single step. However these technologies still have high cost, making it difficult to obtain large number of repetitions of sample data. Therefore, it becomes necessary the discovery and the improvement of efficient statistical methodologies for optimizing analysis of data generated in genome sequencing platforms. The overall objective of this work was to evaluate the effect of the number of repetitions in the identification of differentially expressed genes, in RNA-Seq experiments, contributing to the clarification of the statistic that researchers will assist in data analysis in RNA-Seq experiments. Specifically, we evaluate empirically the effect of the number of repetitions in the statistical analysis of gene expression in RNA-Seq experiments. To carry out the analyses we used a dataset defined in Li et al. (2008), which compared treated and non-treated cancer cells. That work had four biological replications for the control group (non-treated) and three replications for biological treatment group (cells that have received the treatment). The data was analyzed using the package DESeq from the statistical environment R. A total of 2566 genes were considered differentially expressed (DE) when we evaluate the original and complete dataset. When we analyzed three replications of the control and treatment, we found, on average, 2153 genes DE. From the moment in which only two reps for both treatments were used, were identified, on average, 1241 genes DE. The major change in the number of genes DE was observed when replications were not used. In this case we identified around 44 differentially expressed genes. According to the results generated in the analysis, it was possible to verify that the number of repetitions is an essential factor in order to obtain a significant number of differentially expressed genes. |
id |
UFV_27c78461f8211192e03bf1102e71b28d |
---|---|
oai_identifier_str |
oai:locus.ufv.br:123456789/4066 |
network_acronym_str |
UFV |
network_name_str |
LOCUS Repositório Institucional da UFV |
repository_id_str |
2145 |
spelling |
Gonçalves, Jaciane Coelhohttp://lattes.cnpq.br/1015689997791505Nascimento, Moyséshttp://lattes.cnpq.br/6544887498494945Bressan, Gustavo Costahttp://lattes.cnpq.br/1153853218347720Peternelli, Luiz Alexandrehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7Silva, Fernanda Miquelitto Figueira dahttp://lattes.cnpq.br/58243629211333952015-03-26T13:32:18Z2013-07-102015-03-26T13:32:18Z2013-01-16GONÇALVES, Jaciane Coelho. Influence of the number of repetitions in the identification of differentially expressed genes in RNA-Seq experiments. 2013. 40 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.http://locus.ufv.br/handle/123456789/4066One of the current objectives of molecular biology is to measure and assess the gene expression profiles in different types of biological tissues, to understand the mechanisms of molecular transformation under certain conditions. Next-generation sequencing (NGS) technologies promote DNA sequencing in platforms capable of generating information about millions of base pairs in a single step. However these technologies still have high cost, making it difficult to obtain large number of repetitions of sample data. Therefore, it becomes necessary the discovery and the improvement of efficient statistical methodologies for optimizing analysis of data generated in genome sequencing platforms. The overall objective of this work was to evaluate the effect of the number of repetitions in the identification of differentially expressed genes, in RNA-Seq experiments, contributing to the clarification of the statistic that researchers will assist in data analysis in RNA-Seq experiments. Specifically, we evaluate empirically the effect of the number of repetitions in the statistical analysis of gene expression in RNA-Seq experiments. To carry out the analyses we used a dataset defined in Li et al. (2008), which compared treated and non-treated cancer cells. That work had four biological replications for the control group (non-treated) and three replications for biological treatment group (cells that have received the treatment). The data was analyzed using the package DESeq from the statistical environment R. A total of 2566 genes were considered differentially expressed (DE) when we evaluate the original and complete dataset. When we analyzed three replications of the control and treatment, we found, on average, 2153 genes DE. From the moment in which only two reps for both treatments were used, were identified, on average, 1241 genes DE. The major change in the number of genes DE was observed when replications were not used. In this case we identified around 44 differentially expressed genes. According to the results generated in the analysis, it was possible to verify that the number of repetitions is an essential factor in order to obtain a significant number of differentially expressed genes.Um dos objetivos atuais da biologia molecular é medir e avaliar os perfis de expressão gênica em diferentes tipos de tecidos biológicos, para entender os mecanismos de transformação molecular sob determinadas condições. Tecnologias de sequenciamento de Nova Geração (NGS) promovem o sequenciamento de DNA em plataformas capazes de gerar informações sobre milhões de pares de bases em uma única etapa. Porém essas tecnologias ainda apresentam custo elevado, dificultando a obtenção de elevado número de repetições de dados amostrais. Assim, torna-se necessária a descoberta e o aprimoramento de metodologias estatísticas eficientes para a otimização das análises de dados gerados em plataformas de sequenciamento de genomas. O objetivo geral desse trabalho consistiu em avaliar o efeito do número de repetições na identificação de genes diferencialmente expressos, em experimentos de RNA-Seq, contribuindo para o esclarecimento de pesquisadores que venham a auxiliar nas análises de dados em experimentos de RNA-Seq. De forma específica, avaliamos empiricamente o efeito do número de repetições na análise estatística da expressão gênica em experimentos de RNA-Seq. Para a realização das análises foi utilizado um conjunto de dados definido em Li et al. (2008), o qual comparou células cancerígenas tratadas e não tratadas. Naquele estudo havia quatro repetições biológicas para o grupo controle (células não tratadas) e três repetições biológicas para grupo de tratamento (células que receberam o tratamento). Os dados foram analisados utilizando o pacote DESeq do Programa computacional R. Um total de 2566 genes foram considerados diferencialmente expressos (DE) quando avaliamos o conjunto de dados original completo. Quando analisamos três repetições do controle e do tratamento, nós encontramos, em média, 2153 genes DE. A partir do momento em que apenas duas repetições para ambos os tratamentos foram utilizadas, foram identificadas, em média, 1241 genes DE. A grande alteração no número de genes DE foi observada quando repetições não foram utilizadas. Nesse caso identificamos em torno de 44 genes diferencialmente expressos. De acordo com os resultados gerados nas análises, foi possível verificar que o número de repetições é um fator essencial para se obter um número significativo de genes diferencialmente expressos.application/pdfporUniversidade Federal de ViçosaMestrado em Estatística Aplicada e BiometriaUFVBREstatística Aplicada e BiometriaRNA-SeqGenes diferencialmente expressosNúmero de repetiçõesRNA-SeqDifferentially expressed genes, Number of repetitionsCNPQ::CIENCIAS AGRARIASInfluência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-SeqInfluence of the number of repetitions in the identification of differentially expressed genes in RNA-Seq experimentsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdfapplication/pdf619084https://locus.ufv.br//bitstream/123456789/4066/1/texto%20completo.pdf33699c369d9fd3f595c40375c27f4c43MD51TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain68937https://locus.ufv.br//bitstream/123456789/4066/2/texto%20completo.pdf.txt4ebbb3e84b1bb613919d2fa36952da07MD52THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3643https://locus.ufv.br//bitstream/123456789/4066/3/texto%20completo.pdf.jpg47f71e550964101e320c92fa25dabceaMD53123456789/40662016-04-09 23:18:12.035oai:locus.ufv.br:123456789/4066Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-10T02:18:12LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
dc.title.por.fl_str_mv |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq |
dc.title.alternative.eng.fl_str_mv |
Influence of the number of repetitions in the identification of differentially expressed genes in RNA-Seq experiments |
title |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq |
spellingShingle |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq Gonçalves, Jaciane Coelho RNA-Seq Genes diferencialmente expressos Número de repetições RNA-Seq Differentially expressed genes, Number of repetitions CNPQ::CIENCIAS AGRARIAS |
title_short |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq |
title_full |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq |
title_fullStr |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq |
title_full_unstemmed |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq |
title_sort |
Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq |
author |
Gonçalves, Jaciane Coelho |
author_facet |
Gonçalves, Jaciane Coelho |
author_role |
author |
dc.contributor.authorLattes.por.fl_str_mv |
http://lattes.cnpq.br/1015689997791505 |
dc.contributor.author.fl_str_mv |
Gonçalves, Jaciane Coelho |
dc.contributor.advisor-co1.fl_str_mv |
Nascimento, Moysés |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/6544887498494945 |
dc.contributor.advisor-co2.fl_str_mv |
Bressan, Gustavo Costa |
dc.contributor.advisor-co2Lattes.fl_str_mv |
http://lattes.cnpq.br/1153853218347720 |
dc.contributor.advisor1.fl_str_mv |
Peternelli, Luiz Alexandre |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7 |
dc.contributor.referee1.fl_str_mv |
Silva, Fernanda Miquelitto Figueira da |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/5824362921133395 |
contributor_str_mv |
Nascimento, Moysés Bressan, Gustavo Costa Peternelli, Luiz Alexandre Silva, Fernanda Miquelitto Figueira da |
dc.subject.por.fl_str_mv |
RNA-Seq Genes diferencialmente expressos Número de repetições |
topic |
RNA-Seq Genes diferencialmente expressos Número de repetições RNA-Seq Differentially expressed genes, Number of repetitions CNPQ::CIENCIAS AGRARIAS |
dc.subject.eng.fl_str_mv |
RNA-Seq Differentially expressed genes, Number of repetitions |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS AGRARIAS |
description |
One of the current objectives of molecular biology is to measure and assess the gene expression profiles in different types of biological tissues, to understand the mechanisms of molecular transformation under certain conditions. Next-generation sequencing (NGS) technologies promote DNA sequencing in platforms capable of generating information about millions of base pairs in a single step. However these technologies still have high cost, making it difficult to obtain large number of repetitions of sample data. Therefore, it becomes necessary the discovery and the improvement of efficient statistical methodologies for optimizing analysis of data generated in genome sequencing platforms. The overall objective of this work was to evaluate the effect of the number of repetitions in the identification of differentially expressed genes, in RNA-Seq experiments, contributing to the clarification of the statistic that researchers will assist in data analysis in RNA-Seq experiments. Specifically, we evaluate empirically the effect of the number of repetitions in the statistical analysis of gene expression in RNA-Seq experiments. To carry out the analyses we used a dataset defined in Li et al. (2008), which compared treated and non-treated cancer cells. That work had four biological replications for the control group (non-treated) and three replications for biological treatment group (cells that have received the treatment). The data was analyzed using the package DESeq from the statistical environment R. A total of 2566 genes were considered differentially expressed (DE) when we evaluate the original and complete dataset. When we analyzed three replications of the control and treatment, we found, on average, 2153 genes DE. From the moment in which only two reps for both treatments were used, were identified, on average, 1241 genes DE. The major change in the number of genes DE was observed when replications were not used. In this case we identified around 44 differentially expressed genes. According to the results generated in the analysis, it was possible to verify that the number of repetitions is an essential factor in order to obtain a significant number of differentially expressed genes. |
publishDate |
2013 |
dc.date.available.fl_str_mv |
2013-07-10 2015-03-26T13:32:18Z |
dc.date.issued.fl_str_mv |
2013-01-16 |
dc.date.accessioned.fl_str_mv |
2015-03-26T13:32:18Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GONÇALVES, Jaciane Coelho. Influence of the number of repetitions in the identification of differentially expressed genes in RNA-Seq experiments. 2013. 40 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013. |
dc.identifier.uri.fl_str_mv |
http://locus.ufv.br/handle/123456789/4066 |
identifier_str_mv |
GONÇALVES, Jaciane Coelho. Influence of the number of repetitions in the identification of differentially expressed genes in RNA-Seq experiments. 2013. 40 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013. |
url |
http://locus.ufv.br/handle/123456789/4066 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.publisher.program.fl_str_mv |
Mestrado em Estatística Aplicada e Biometria |
dc.publisher.initials.fl_str_mv |
UFV |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Estatística Aplicada e Biometria |
publisher.none.fl_str_mv |
Universidade Federal de Viçosa |
dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
instname_str |
Universidade Federal de Viçosa (UFV) |
instacron_str |
UFV |
institution |
UFV |
reponame_str |
LOCUS Repositório Institucional da UFV |
collection |
LOCUS Repositório Institucional da UFV |
bitstream.url.fl_str_mv |
https://locus.ufv.br//bitstream/123456789/4066/1/texto%20completo.pdf https://locus.ufv.br//bitstream/123456789/4066/2/texto%20completo.pdf.txt https://locus.ufv.br//bitstream/123456789/4066/3/texto%20completo.pdf.jpg |
bitstream.checksum.fl_str_mv |
33699c369d9fd3f595c40375c27f4c43 4ebbb3e84b1bb613919d2fa36952da07 47f71e550964101e320c92fa25dabcea |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
repository.mail.fl_str_mv |
fabiojreis@ufv.br |
_version_ |
1801212878852718592 |