Métodos estatísticos para modelagem de dados de scRNA-seq

Detalhes bibliográficos
Autor(a) principal: Menezes, André Felipe Berdusco, 1996-
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1641292
Resumo: Orientador: Benilton de Sá Carvalho
id UNICAMP-30_dd48b43e793b6972382a098fdd87eee5
oai_identifier_str oai::1164470
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Métodos estatísticos para modelagem de dados de scRNA-seqStatistical methods for scRNA-seq data modelingscRNA-seqDados omicsExpressão gênica diferencialBioestatísticaAnálise por agrupamentoscRNA-seqOmics dataDifferential expressionCluster analysisBiostatisticsOrientador: Benilton de Sá CarvalhoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação CientíficaResumo: A tecnologia de sequenciamento massivo de DNA e RNA permitiu desenvolvimentos significativos na área de biomédicas, culminando, neste momento, na implementação da medicina de precisão, em que informações moleculares do paciente são levadas em consideração para a tomada de decisão no curso de tratamento. Em geral, o sequenciamento de DNA ou RNA é realizado a partir de uma amostra do tipo bulk, em que o material molecular de várias células é combinado para a realização das análises de interesse. Com o avanço tecnológico mais recente, tornou-se possível o sequenciamento do material genético no nível das células, permitindo a análise de fenótipos de interesse, como doenças diversas, numa resolução ainda mais granular que aquela oferecida por amostras do tipo bulk. Especificamente, a tecnologia de single-cell RNA sequencing (scRNA-seq) permite criar perfis de expressão na resolução da célula. A vasta quantidade de dados produzida por experimentos de scRNA-seq e as hipóteses de pesquisa que os motivam exigem um tratamento computacional e estatístico eficiente. Nesse sentido, o objetivo dessa pesquisa foi estudar as técnicas utilizadas para análise dos dados em experimentos scRNA-seq, que incluem (i) métodos para pré-processamento, (ii) processamento da matriz de contagem e (iii) métodos estatísticos para análise dos dados. Além disso, motivado por um conjunto de dados de células do tecido BALF de pacientes com COVID-19, um estudo de simulação foi conduzido considerando as características particulares dos dados para comparar diferentes abordagens para análise de expressão diferencial que incorporam a origem da célula. Por fim, o fluxo usual de análise discutido no trabalho foi empregado para analisar o conjunto de dados de células BALF, caracterizando grupos de células e comparando os níveis de expressão gênica dos indivíduos sob diferentes condições experimentaisAbstract: High-throughput sequencing technology allowed significant developments in the biomedical area, culminating, at this moment, in the implementation of precision medicine, where the patient's molecular information is taken into consideration for decision making in the treatment course. In general, the DNA or RNA sequencing is performed from bulk sample, where the molecular material of several cells is combined to perform the analysis of interested. Especially, the technology of single cell RNA sequencing (scRNA-seq) enables high-throughput transcriptome profiling at the resolution of single cells. The vast amount of data produced by scRNA-seq experiments and the research hypotheses that motivate them require efficient computational and statistical treatment. Hence, the goal of this research was to study the techniques used for data analysis in scRNA-seq, which include (i) methods for pre-processing raw data, (ii) data processing of counting matrix and (iii) statistical methods for data analysis. In addition, motivated by a data set of cells from bronchoalveolar lavage fluid (BALF) tissue from patients with COVID-19, a simulation study was conducted, considering the particularities of the data, to compare different approaches for differential expression analysis that incorporate the cell's origin. Finally, the usual workflow discussed in the research was adopted to analyze the BALF cells data set by characterizing groups of cells and comparing the expression genes levels of individuals under different experimental conditionsMestradoEstatísticaMestre em EstatísticaCNPQ132278/2019-7[s.n.]Carvalho, Benilton de Sá, 1979-Kiihl, Samara FlaminiVeiga, Diogo FernandoUniversidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação CientíficaPrograma de Pós-Graduação em EstatísticaUNIVERSIDADE ESTADUAL DE CAMPINASMenezes, André Felipe Berdusco, 1996-20212021-04-15T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (146 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1641292MENEZES, André Felipe Berdusco. Métodos estatísticos para modelagem de dados de scRNA-seq. 2021. 1 recurso online (146 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641292. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/1164470Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2021-05-10T11:39:56Zoai::1164470Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2021-05-10T11:39:56Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Métodos estatísticos para modelagem de dados de scRNA-seq
Statistical methods for scRNA-seq data modeling
title Métodos estatísticos para modelagem de dados de scRNA-seq
spellingShingle Métodos estatísticos para modelagem de dados de scRNA-seq
Menezes, André Felipe Berdusco, 1996-
scRNA-seq
Dados omics
Expressão gênica diferencial
Bioestatística
Análise por agrupamento
scRNA-seq
Omics data
Differential expression
Cluster analysis
Biostatistics
title_short Métodos estatísticos para modelagem de dados de scRNA-seq
title_full Métodos estatísticos para modelagem de dados de scRNA-seq
title_fullStr Métodos estatísticos para modelagem de dados de scRNA-seq
title_full_unstemmed Métodos estatísticos para modelagem de dados de scRNA-seq
title_sort Métodos estatísticos para modelagem de dados de scRNA-seq
author Menezes, André Felipe Berdusco, 1996-
author_facet Menezes, André Felipe Berdusco, 1996-
author_role author
dc.contributor.none.fl_str_mv Carvalho, Benilton de Sá, 1979-
Kiihl, Samara Flamini
Veiga, Diogo Fernando
Universidade Estadual de Campinas (UNICAMP). Instituto de Matemática, Estatística e Computação Científica
Programa de Pós-Graduação em Estatística
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Menezes, André Felipe Berdusco, 1996-
dc.subject.por.fl_str_mv scRNA-seq
Dados omics
Expressão gênica diferencial
Bioestatística
Análise por agrupamento
scRNA-seq
Omics data
Differential expression
Cluster analysis
Biostatistics
topic scRNA-seq
Dados omics
Expressão gênica diferencial
Bioestatística
Análise por agrupamento
scRNA-seq
Omics data
Differential expression
Cluster analysis
Biostatistics
description Orientador: Benilton de Sá Carvalho
publishDate 2021
dc.date.none.fl_str_mv 2021
2021-04-15T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1641292
MENEZES, André Felipe Berdusco. Métodos estatísticos para modelagem de dados de scRNA-seq. 2021. 1 recurso online (146 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641292. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1641292
identifier_str_mv MENEZES, André Felipe Berdusco. Métodos estatísticos para modelagem de dados de scRNA-seq. 2021. 1 recurso online (146 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1641292. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1164470
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (146 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189173045755904