Métodos estatísticos para modelagem de dados de scRNA-seq
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1641292 |
Resumo: | Orientador: Benilton de Sá Carvalho |
id |
UNICAMP-30_dd48b43e793b6972382a098fdd87eee5 |
---|---|
oai_identifier_str |
oai::1164470 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Métodos estatísticos para modelagem de dados de scRNA-seqStatistical methods for scRNA-seq data modelingscRNA-seqDados omicsExpressão gênica diferencialBioestatísticaAnálise por agrupamentoscRNA-seqOmics dataDifferential expressionCluster analysisBiostatisticsOrientador: Benilton de Sá CarvalhoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação CientíficaResumo: A tecnologia de sequenciamento massivo de DNA e RNA permitiu desenvolvimentos significativos na área de biomédicas, culminando, neste momento, na implementação da medicina de precisão, em que informações moleculares do paciente são levadas em consideração para a tomada de decisão no curso de tratamento. Em geral, o sequenciamento de DNA ou RNA é realizado a partir de uma amostra do tipo bulk, em que o material molecular de várias células é combinado para a realização das análises de interesse. Com o avanço tecnológico mais recente, tornou-se possível o sequenciamento do material genético no nível das células, permitindo a análise de fenótipos de interesse, como doenças diversas, numa resolução ainda mais granular que aquela oferecida por amostras do tipo bulk. Especificamente, a tecnologia de single-cell RNA sequencing (scRNA-seq) permite criar perfis de expressão na resolução da célula. A vasta quantidade de dados produzida por experimentos de scRNA-seq e as hipóteses de pesquisa que os motivam exigem um tratamento computacional e estatístico eficiente. Nesse sentido, o objetivo dessa pesquisa foi estudar as técnicas utilizadas para análise dos dados em experimentos scRNA-seq, que incluem (i) métodos para pré-processamento, (ii) processamento da matriz de contagem e (iii) métodos estatísticos para análise dos dados. Além disso, motivado por um conjunto de dados de células do tecido BALF de pacientes com COVID-19, um estudo de simulação foi conduzido considerando as características particulares dos dados para comparar diferentes abordagens para análise de expressão diferencial que incorporam a origem da célula. Por fim, o fluxo usual de análise discutido no trabalho foi empregado para analisar o conjunto de dados de células BALF, caracterizando grupos de células e comparando os níveis de expressão gênica dos indivíduos sob diferentes condições experimentaisAbstract: High-throughput sequencing technology allowed significant developments in the biomedical area, culminating, at this moment, in the implementation of precision medicine, where the patient's molecular information is taken into consideration for decision making in the treatment course. In general, the DNA or RNA sequencing is performed from bulk sample, where the molecular material of several cells is combined to perform the analysis of interested. Especially, the technology of single cell RNA sequencing (scRNA-seq) enables high-throughput transcriptome profiling at the resolution of single cells. The vast amount of data produced by scRNA-seq experiments and the research hypotheses that motivate them require efficient computational and statistical treatment. Hence, the goal of this research was to study the techniques used for data analysis in scRNA-seq, which include (i) methods for pre-processing raw data, (ii) data processing of counting matrix and (iii) statistical methods for data analysis. In addition, motivated by a data set of cells from bronchoalveolar lavage fluid (BALF) tissue from patients with COVID-19, a simulation study was conducted, considering the particularities of the data, to compare different approaches for differential expression analysis that incorporate the cell's origin. Finally, the usual workflow discussed in the research was adopted to analyze the BALF cells data set by characterizing groups of cells and comparing the expression genes levels of individuals under different experimental conditionsMestradoEstatísticaMestre em EstatísticaCNPQ132278/2019-7[s.n.]Carvalho, Benilton de Sá, 1979-Kiihl, Samara FlaminiVeiga, Diogo FernandoUniversidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação CientíficaPrograma de Pós-Graduação em EstatísticaUNIVERSIDADE ESTADUAL DE CAMPINASMenezes, André Felipe Berdusco, 1996-20212021-04-15T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (146 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1641292MENEZES, André Felipe Berdusco. Métodos estatísticos para modelagem de dados de scRNA-seq. 2021. 1 recurso online (146 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641292. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1164470Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-05-10T11:39:56Zoai::1164470Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-05-10T11:39:56Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Métodos estatísticos para modelagem de dados de scRNA-seq Statistical methods for scRNA-seq data modeling |
title |
Métodos estatísticos para modelagem de dados de scRNA-seq |
spellingShingle |
Métodos estatísticos para modelagem de dados de scRNA-seq Menezes, André Felipe Berdusco, 1996- scRNA-seq Dados omics Expressão gênica diferencial Bioestatística Análise por agrupamento scRNA-seq Omics data Differential expression Cluster analysis Biostatistics |
title_short |
Métodos estatísticos para modelagem de dados de scRNA-seq |
title_full |
Métodos estatísticos para modelagem de dados de scRNA-seq |
title_fullStr |
Métodos estatísticos para modelagem de dados de scRNA-seq |
title_full_unstemmed |
Métodos estatísticos para modelagem de dados de scRNA-seq |
title_sort |
Métodos estatísticos para modelagem de dados de scRNA-seq |
author |
Menezes, André Felipe Berdusco, 1996- |
author_facet |
Menezes, André Felipe Berdusco, 1996- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Carvalho, Benilton de Sá, 1979- Kiihl, Samara Flamini Veiga, Diogo Fernando Universidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação Científica Programa de Pós-Graduação em Estatística UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Menezes, André Felipe Berdusco, 1996- |
dc.subject.por.fl_str_mv |
scRNA-seq Dados omics Expressão gênica diferencial Bioestatística Análise por agrupamento scRNA-seq Omics data Differential expression Cluster analysis Biostatistics |
topic |
scRNA-seq Dados omics Expressão gênica diferencial Bioestatística Análise por agrupamento scRNA-seq Omics data Differential expression Cluster analysis Biostatistics |
description |
Orientador: Benilton de Sá Carvalho |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2021-04-15T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1641292 MENEZES, André Felipe Berdusco. Métodos estatísticos para modelagem de dados de scRNA-seq. 2021. 1 recurso online (146 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641292. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1641292 |
identifier_str_mv |
MENEZES, André Felipe Berdusco. Métodos estatísticos para modelagem de dados de scRNA-seq. 2021. 1 recurso online (146 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641292. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1164470 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (146 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189173045755904 |