Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos

Detalhes bibliográficos
Autor(a) principal: Souza, Camila Alves de
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-29112022-121409/
Resumo: Com o avanço das tecnologias citogenômicas, tornou-se possível a detecção confiável de diversas alterações genômicas e a determinação da ancestralidade dos indivíduos, uma importante ferramenta de entendimento da origem e da história das populações, bem como, fonte de decisões no contexto de saúde pública. Dentre os diferentes tipos de variação genética, existem as Copy Number Variation (CNV) que são ganhos ou perdas de segmentos de DNA. Diversos trabalhos associam as CNVs a diferentes tipos de fenótipos envolvidos com doenças monogênicas bem como multifatoriais. Outra variação genética importante é a Loss of heterozygosity (LOH), uma instabilidade cromossômica caracterizada pelo desequilíbrio alélico, onde uma região genômica heterozigota se torna homozigota através da perda de um dos alelos. As regiões homozigotas podem representar populações, determinar nível de consanguinidade e diversos estudos correlacionam as regiões LOH como uma das principais causas de tumorigênese. Neste trabalho, tendo em vista a importância da determinação da ancestralidade dos indivíduos e do impacto das variantes CNV e das LOHs ao contexto da saúde humana, o objetivo é construir bancos de dados de ancestralidade, CNVs e LOH a partir dos dados do projeto ISA-Nutrição, genotipados através da plataforma Axiom 2.0 (Affymetrix, Thermo Fisher). Tal informação permitirá correlacionar variações moleculares a fenótipos que sejam relevantes ao grupo de estudo, contribuindo assim para o melhor entendimento do perfil do brasileiro. O processamento dos dados envolvido neste trabalho não é tarefa simples pois exige a execução de diferentes pipelines que utilizam diferentes softwares como PLINK, além de softwares proprietários disponibilizados pela Affymetrix e bibliotecas das linguagens R e Python. Neste sentido, uma contribuição do presente trabalho é propor um pipeline customizado para análise de ancestralidade e identificação de regiões de CNV e de LOH a partir de dados de SNParray. Resultados: Como esperado, a amostra ISA-Nutrição permitiu caracterizar a alta miscigenação da população brasileira e alguns indivíduos apresentaram diferenças entre a raça autodeclarada e as proporções ancestrais das populações em comparação com o projeto 1000 genomas. Foram detectadas 34.824 CNVs para as 841 amostras do estudo, variando entre 49.3kb (CN=0) a 33.5Mb (CN=3). As LOHs tiveram média de 1,5% nos cromossomos autossômicos, foram detectadas 26.558 nas 841 amostras e variaram entre 1Mb e 108Mb.
id USP_c45d9a737677f388284a10d79e9a41bb
oai_identifier_str oai:teses.usp.br:tde-29112022-121409
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexosMapping and study of association of DNA Copy Number Variations (CNVs) and Loss of Heterozygosity Regions (LOH) with complex phenotypesAncestralidadeAncestryCopy number variationCopy number variationLoss of heterozygosityLoss of heterozygosityCom o avanço das tecnologias citogenômicas, tornou-se possível a detecção confiável de diversas alterações genômicas e a determinação da ancestralidade dos indivíduos, uma importante ferramenta de entendimento da origem e da história das populações, bem como, fonte de decisões no contexto de saúde pública. Dentre os diferentes tipos de variação genética, existem as Copy Number Variation (CNV) que são ganhos ou perdas de segmentos de DNA. Diversos trabalhos associam as CNVs a diferentes tipos de fenótipos envolvidos com doenças monogênicas bem como multifatoriais. Outra variação genética importante é a Loss of heterozygosity (LOH), uma instabilidade cromossômica caracterizada pelo desequilíbrio alélico, onde uma região genômica heterozigota se torna homozigota através da perda de um dos alelos. As regiões homozigotas podem representar populações, determinar nível de consanguinidade e diversos estudos correlacionam as regiões LOH como uma das principais causas de tumorigênese. Neste trabalho, tendo em vista a importância da determinação da ancestralidade dos indivíduos e do impacto das variantes CNV e das LOHs ao contexto da saúde humana, o objetivo é construir bancos de dados de ancestralidade, CNVs e LOH a partir dos dados do projeto ISA-Nutrição, genotipados através da plataforma Axiom 2.0 (Affymetrix, Thermo Fisher). Tal informação permitirá correlacionar variações moleculares a fenótipos que sejam relevantes ao grupo de estudo, contribuindo assim para o melhor entendimento do perfil do brasileiro. O processamento dos dados envolvido neste trabalho não é tarefa simples pois exige a execução de diferentes pipelines que utilizam diferentes softwares como PLINK, além de softwares proprietários disponibilizados pela Affymetrix e bibliotecas das linguagens R e Python. Neste sentido, uma contribuição do presente trabalho é propor um pipeline customizado para análise de ancestralidade e identificação de regiões de CNV e de LOH a partir de dados de SNParray. Resultados: Como esperado, a amostra ISA-Nutrição permitiu caracterizar a alta miscigenação da população brasileira e alguns indivíduos apresentaram diferenças entre a raça autodeclarada e as proporções ancestrais das populações em comparação com o projeto 1000 genomas. Foram detectadas 34.824 CNVs para as 841 amostras do estudo, variando entre 49.3kb (CN=0) a 33.5Mb (CN=3). As LOHs tiveram média de 1,5% nos cromossomos autossômicos, foram detectadas 26.558 nas 841 amostras e variaram entre 1Mb e 108Mb.With the advancement of cytogenomic technologies, it became possible to reliably detect several genomic alterations and determine the ancestry of individuals, an important tool for understanding the origin and history of populations, as well as a source of decisions in the context of public health. Among the different types of genetic variation, there are Copy Number Variation (CNV) which are gains or losses of DNA segments. Several studies associate CNVs with different types of phenotypes involved with monogenic as well as multifactorial diseases. Another important genetic variation is Loss of heterozygosity (LOH), a chromosomal instability characterized by allelic imbalance, where a heterozygous genomic region becomes homozygous through the loss of one of the alleles. Homozygous regions can represent populations, determine level of consanguinity, and several studies have correlated LOH regions as one of the main causes of tumorigenesis. In this work, in view of the importance of determining the ancestry of individuals and the impact of CNV and LOH variants in the context of human health, the objective is to build ancestry databases, CNVs and LOH from data from the ISA- Nutrition, genotyped using the Axiom 2.0 platform (Affymetrix, Thermo Fisher). Such information will allow the correlation of molecular variations to phenotypes that are relevant to the study group, thus contributing to a better understanding of the Brazilian profile. The data processing involved in this work is not a simple task as it requires the execution of different pipelines that use different software such as PLINK, and proprietary software provided by Affymetrix and R and Python language libraries. In this sense, a contribution of the present work is to propose a customized pipeline for ancestry analysis and identification of CNV and LOH regions from SNParray data. Results: As expected, ISA-Nutrition data showed the high miscegenation of the Brazilian population, and some individuals show differences between selfreported race and ancestral proportions of populations compared to the 1000genomas project. In total 34,824 CNVs were detected for the 841 samples of the study, ranging from 49.3kb (CN=0) to 33.5Mb (CN=3). The LOHs had an average of 1.5% in the autosomal chromosomes, 26,558 were detected in the 841 samples, and ranged from 1Mb to 108Mb.Biblioteca Digitais de Teses e Dissertações da USPSoler, Julia Maria PavanSouza, Camila Alves de2022-11-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/95/95131/tde-29112022-121409/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-12-12T15:22:51Zoai:teses.usp.br:tde-29112022-121409Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-12-12T15:22:51Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
Mapping and study of association of DNA Copy Number Variations (CNVs) and Loss of Heterozygosity Regions (LOH) with complex phenotypes
title Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
spellingShingle Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
Souza, Camila Alves de
Ancestralidade
Ancestry
Copy number variation
Copy number variation
Loss of heterozygosity
Loss of heterozygosity
title_short Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
title_full Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
title_fullStr Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
title_full_unstemmed Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
title_sort Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
author Souza, Camila Alves de
author_facet Souza, Camila Alves de
author_role author
dc.contributor.none.fl_str_mv Soler, Julia Maria Pavan
dc.contributor.author.fl_str_mv Souza, Camila Alves de
dc.subject.por.fl_str_mv Ancestralidade
Ancestry
Copy number variation
Copy number variation
Loss of heterozygosity
Loss of heterozygosity
topic Ancestralidade
Ancestry
Copy number variation
Copy number variation
Loss of heterozygosity
Loss of heterozygosity
description Com o avanço das tecnologias citogenômicas, tornou-se possível a detecção confiável de diversas alterações genômicas e a determinação da ancestralidade dos indivíduos, uma importante ferramenta de entendimento da origem e da história das populações, bem como, fonte de decisões no contexto de saúde pública. Dentre os diferentes tipos de variação genética, existem as Copy Number Variation (CNV) que são ganhos ou perdas de segmentos de DNA. Diversos trabalhos associam as CNVs a diferentes tipos de fenótipos envolvidos com doenças monogênicas bem como multifatoriais. Outra variação genética importante é a Loss of heterozygosity (LOH), uma instabilidade cromossômica caracterizada pelo desequilíbrio alélico, onde uma região genômica heterozigota se torna homozigota através da perda de um dos alelos. As regiões homozigotas podem representar populações, determinar nível de consanguinidade e diversos estudos correlacionam as regiões LOH como uma das principais causas de tumorigênese. Neste trabalho, tendo em vista a importância da determinação da ancestralidade dos indivíduos e do impacto das variantes CNV e das LOHs ao contexto da saúde humana, o objetivo é construir bancos de dados de ancestralidade, CNVs e LOH a partir dos dados do projeto ISA-Nutrição, genotipados através da plataforma Axiom 2.0 (Affymetrix, Thermo Fisher). Tal informação permitirá correlacionar variações moleculares a fenótipos que sejam relevantes ao grupo de estudo, contribuindo assim para o melhor entendimento do perfil do brasileiro. O processamento dos dados envolvido neste trabalho não é tarefa simples pois exige a execução de diferentes pipelines que utilizam diferentes softwares como PLINK, além de softwares proprietários disponibilizados pela Affymetrix e bibliotecas das linguagens R e Python. Neste sentido, uma contribuição do presente trabalho é propor um pipeline customizado para análise de ancestralidade e identificação de regiões de CNV e de LOH a partir de dados de SNParray. Resultados: Como esperado, a amostra ISA-Nutrição permitiu caracterizar a alta miscigenação da população brasileira e alguns indivíduos apresentaram diferenças entre a raça autodeclarada e as proporções ancestrais das populações em comparação com o projeto 1000 genomas. Foram detectadas 34.824 CNVs para as 841 amostras do estudo, variando entre 49.3kb (CN=0) a 33.5Mb (CN=3). As LOHs tiveram média de 1,5% nos cromossomos autossômicos, foram detectadas 26.558 nas 841 amostras e variaram entre 1Mb e 108Mb.
publishDate 2022
dc.date.none.fl_str_mv 2022-11-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/95/95131/tde-29112022-121409/
url https://www.teses.usp.br/teses/disponiveis/95/95131/tde-29112022-121409/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809091190651355136