Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ

Detalhes bibliográficos
Autor(a) principal: Tambonis, Tiago [UNESP]
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/127589
Resumo: We are living in a time where advances in areas related to biology are routine, taking us to accustom to experiments with large number of variables. The RNA sequencing technology (RNA-Seq) is part of this framework and computational approaches applied in this context are not fully established and require more detailed analysis. Generally, in a experiment of analysis of di erential expression, total RNA samples or messengers (mRNA) is extracted, puri ed, fragmented, sequenced, mapped, and nally counted, generating an count table that relates how many reads was aligned to a given gene in a experimental condition. From this stage, it is proposed to use a variational method, called Suvrel (Supervised Variational Relevance), based on the minimization of a cost function that penalizes large distances between the same class of elements and favors small distances between di erent classes of elements to make the inference of relevance of each gene. The application of the method was performed on count table produced after of sequencing, alignment and summarization of 5 technical replicates containing Strategene Universal Human Reference RNA (UHRR) (part of Sequencing Quality Control Consortium, SEQC) together with ERCC 1 mix, and 5 technical replicates containing Ambion's Human Brain Reference RNA (HBRR) (part of SEQC also) together with the ERCC 2 mix. Using the ROC (Receiver Operating characteristic) curves generating from data of MAC-II project, setting the transcripts with log of fold-change greater than a cuto (from 0.5 to 2.0) as true positive and the others as true negative, the curves 6.2 and 6.4 were generated. From these graphs it is possible to conclude that the Suvrel method has higher AUCs in most of cuto s. It is appropriate to note that conclusions were obtained using a method that does not make any assumption about the distribution associated with the reads, using a simple normalization (divide the counts of a gene by its standard ...
id UNSP_4d923530b69eca504277628ed7d68b3a
oai_identifier_str oai:repositorio.unesp.br:11449/127589
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQBiologia molecularBiofísicaExpressão gênicaSeqüenciamento de nucleotídeoPesquisa quantitativaWe are living in a time where advances in areas related to biology are routine, taking us to accustom to experiments with large number of variables. The RNA sequencing technology (RNA-Seq) is part of this framework and computational approaches applied in this context are not fully established and require more detailed analysis. Generally, in a experiment of analysis of di erential expression, total RNA samples or messengers (mRNA) is extracted, puri ed, fragmented, sequenced, mapped, and nally counted, generating an count table that relates how many reads was aligned to a given gene in a experimental condition. From this stage, it is proposed to use a variational method, called Suvrel (Supervised Variational Relevance), based on the minimization of a cost function that penalizes large distances between the same class of elements and favors small distances between di erent classes of elements to make the inference of relevance of each gene. The application of the method was performed on count table produced after of sequencing, alignment and summarization of 5 technical replicates containing Strategene Universal Human Reference RNA (UHRR) (part of Sequencing Quality Control Consortium, SEQC) together with ERCC 1 mix, and 5 technical replicates containing Ambion's Human Brain Reference RNA (HBRR) (part of SEQC also) together with the ERCC 2 mix. Using the ROC (Receiver Operating characteristic) curves generating from data of MAC-II project, setting the transcripts with log of fold-change greater than a cuto (from 0.5 to 2.0) as true positive and the others as true negative, the curves 6.2 and 6.4 were generated. From these graphs it is possible to conclude that the Suvrel method has higher AUCs in most of cuto s. It is appropriate to note that conclusions were obtained using a method that does not make any assumption about the distribution associated with the reads, using a simple normalization (divide the counts of a gene by its standard ...Estamos vivendo uma época onde os avanços das áreas ligadas a biologia são rotineiros, nos levando cada vez mais a nos habituar a experimentos com um grande número de variáveis. A tecnologia de sequenciamento de RNA (RNA-Seq) e parte deste quadro e as abordagens computacionais aplicadas neste âmbito não estão totalmente estabelecidas e necessitam de análises mais detalhadas. A partir da tabela de contagens, que sumariza cada biblioteca em uma condição experimental, propõe-se a utilização de um método variacional chamado de Suvrel, baseado na minimização de uma função custo que penaliza grandes distâncias entre elementos de mesma classe e favorece pequenas distâncias entre elementos de classes diferentes, para inferência de expressão diferencial. A aplicação do método foi realizada em uma tabela de contagens produzida após o sequenciamento, alinhamento e sumarização de 5 replicatas técnicas de RNA de referência humano juntamente com a mistura ERCC 1 e 5 replicatas técnicas de RNA de referência do cérebro humano juntamente com a mistura ERCC 2. Utilizando curvas ROC produzidas com os dados do projeto do MAQC-II, de nindo os transcritos analisados pelo projeto com log2 do fold-change maior que um limiar que varia de 0,5 a 2,0 como os verdadeiros positivos e os restantes como verdadeiros negativos, e poss vel concluir que o m etodo Suvrel tem maiores valores abaixo das curvas ROC na maior parte dos limiares. Utilizando curvas ROC produzidas com os dados do ERCC, geradas utilizando o logs das mudan cas das propor c~oes prede nidas das misturas ERCC 1 e 2 de 92 oligonucleot dios, e poss vel concluir que o m etodo Suvrel tem a maior area abaixo da curva ROC. Embora as a reas abaixo das curvas ROC sejam compar aveis as de outros pacotes (como por exemplo o edgeR), e importante ressaltar que elas foram produzidas usando um m etodo que não faz nenhum tipo de suposição quanto a distribuição associada aos reads...Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Universidade Estadual Paulista (Unesp)Leite, Vitor B. Pereira [UNESP]Universidade Estadual Paulista (Unesp)Tambonis, Tiago [UNESP]2015-09-17T15:24:23Z2015-09-17T15:24:23Z2014-05-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis69 f. : il. color., gráfs., tabs.application/pdfTAMBONIS, Tiago. Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ. 2015. 69 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2015.http://hdl.handle.net/11449/127589000846322000846322.pdf33004153068P9Alephreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESPporinfo:eu-repo/semantics/openAccess2023-10-17T06:02:56Zoai:repositorio.unesp.br:11449/127589Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T15:09:01.883903Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
title Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
spellingShingle Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
Tambonis, Tiago [UNESP]
Biologia molecular
Biofísica
Expressão gênica
Seqüenciamento de nucleotídeo
Pesquisa quantitativa
title_short Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
title_full Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
title_fullStr Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
title_full_unstemmed Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
title_sort Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ
author Tambonis, Tiago [UNESP]
author_facet Tambonis, Tiago [UNESP]
author_role author
dc.contributor.none.fl_str_mv Leite, Vitor B. Pereira [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Tambonis, Tiago [UNESP]
dc.subject.por.fl_str_mv Biologia molecular
Biofísica
Expressão gênica
Seqüenciamento de nucleotídeo
Pesquisa quantitativa
topic Biologia molecular
Biofísica
Expressão gênica
Seqüenciamento de nucleotídeo
Pesquisa quantitativa
description We are living in a time where advances in areas related to biology are routine, taking us to accustom to experiments with large number of variables. The RNA sequencing technology (RNA-Seq) is part of this framework and computational approaches applied in this context are not fully established and require more detailed analysis. Generally, in a experiment of analysis of di erential expression, total RNA samples or messengers (mRNA) is extracted, puri ed, fragmented, sequenced, mapped, and nally counted, generating an count table that relates how many reads was aligned to a given gene in a experimental condition. From this stage, it is proposed to use a variational method, called Suvrel (Supervised Variational Relevance), based on the minimization of a cost function that penalizes large distances between the same class of elements and favors small distances between di erent classes of elements to make the inference of relevance of each gene. The application of the method was performed on count table produced after of sequencing, alignment and summarization of 5 technical replicates containing Strategene Universal Human Reference RNA (UHRR) (part of Sequencing Quality Control Consortium, SEQC) together with ERCC 1 mix, and 5 technical replicates containing Ambion's Human Brain Reference RNA (HBRR) (part of SEQC also) together with the ERCC 2 mix. Using the ROC (Receiver Operating characteristic) curves generating from data of MAC-II project, setting the transcripts with log of fold-change greater than a cuto (from 0.5 to 2.0) as true positive and the others as true negative, the curves 6.2 and 6.4 were generated. From these graphs it is possible to conclude that the Suvrel method has higher AUCs in most of cuto s. It is appropriate to note that conclusions were obtained using a method that does not make any assumption about the distribution associated with the reads, using a simple normalization (divide the counts of a gene by its standard ...
publishDate 2014
dc.date.none.fl_str_mv 2014-05-19
2015-09-17T15:24:23Z
2015-09-17T15:24:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv TAMBONIS, Tiago. Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ. 2015. 69 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2015.
http://hdl.handle.net/11449/127589
000846322
000846322.pdf
33004153068P9
identifier_str_mv TAMBONIS, Tiago. Análise do método suvrel na expressão diferencial a partir da matriz de contagens gerada com dados de RNA-SEQ. 2015. 69 f. Dissertação (mestrado) - Universidade Estadual Paulista Julio de Mesquita Filho, Instituto de Biociências, Letras e Ciências Exatas, 2015.
000846322
000846322.pdf
33004153068P9
url http://hdl.handle.net/11449/127589
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 69 f. : il. color., gráfs., tabs.
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv Aleph
reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128467271680000