Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade

Detalhes bibliográficos
Autor(a) principal: Silva, Nayane dos Santos Brito
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/204819
Resumo: O gene HLA-B é possivelmente o mais variável do genoma humano, com quase oito mil sequências diferentes descritas no banco de dados IPD-IMGT/HLA. Este gene codifica uma molécula fundamental para a apresentação do antígeno aos linfócitos T CD8 + e modulação das células NK. Embora largamente estudado, a maioria dos estudos avaliaram apenas éxons, geralmente negligenciando sequências intrônicas e regulatórias em um contexto populacional. Da mesma forma, muitos dos estudos utilizaram métodos que detectam apenas variantes conhecidas, provavelmente subestimando a variabilidade deste gene. Neste estudo utilizamos um método computacional adequado para avaliar a variabilidade genética do gene HLA-B completo (incluindo todos os éxons, íntrons e regiões regulatórias), a partir de dados de sequenciamento de nova geração em 3.648 amostras de 29 populações mundiais diferentes, em todos os níveis: SNPs, haplótipos, sequências completas e de proteínas codificadas. Foram detectados 610 sítios de variação ao longo do gene HLA-B. A diversidade nucleotídica foi alta nos éxons 1, 2 e 3, e também no íntron 1. A região entre o íntron 3 e o éxon 7 é a mais conservada, com baixa diversidade nucleotídica no éxon 4 e sem nenhuma variante no éxon 6. Detectamos 535 sequências completas do gene HLA-B e 191 sequências codificadoras (apenas éxons), as quais codificam 171 proteínas distintas. Nosso método computacional se mostrou eficaz na obtenção de genótipos e haplótipos acurados do gene HLA-B. A maioria dos SNPs são compartilhados entre todas as populações, enquanto o oposto é observado para os haplótipos e sequências de proteínas. No entanto, essas populações compartilham as mesmas regiões regulatórias. Além disso, a amostra brasileira introduziu novos alelos e aumentou a frequência de alelos raros que estavam presentes no 1000Genomes.
id UNSP_3a7b49a3549d99d6d6322cc395288111
oai_identifier_str oai:repositorio.unesp.br:11449/204819
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidadeGenetic diversity of the HLA-B gene in populations with different ancestry backgrounds.HLA-BVariabilidadeNGSBrasilPopulações mundiais1000GenomesVariabilityO gene HLA-B é possivelmente o mais variável do genoma humano, com quase oito mil sequências diferentes descritas no banco de dados IPD-IMGT/HLA. Este gene codifica uma molécula fundamental para a apresentação do antígeno aos linfócitos T CD8 + e modulação das células NK. Embora largamente estudado, a maioria dos estudos avaliaram apenas éxons, geralmente negligenciando sequências intrônicas e regulatórias em um contexto populacional. Da mesma forma, muitos dos estudos utilizaram métodos que detectam apenas variantes conhecidas, provavelmente subestimando a variabilidade deste gene. Neste estudo utilizamos um método computacional adequado para avaliar a variabilidade genética do gene HLA-B completo (incluindo todos os éxons, íntrons e regiões regulatórias), a partir de dados de sequenciamento de nova geração em 3.648 amostras de 29 populações mundiais diferentes, em todos os níveis: SNPs, haplótipos, sequências completas e de proteínas codificadas. Foram detectados 610 sítios de variação ao longo do gene HLA-B. A diversidade nucleotídica foi alta nos éxons 1, 2 e 3, e também no íntron 1. A região entre o íntron 3 e o éxon 7 é a mais conservada, com baixa diversidade nucleotídica no éxon 4 e sem nenhuma variante no éxon 6. Detectamos 535 sequências completas do gene HLA-B e 191 sequências codificadoras (apenas éxons), as quais codificam 171 proteínas distintas. Nosso método computacional se mostrou eficaz na obtenção de genótipos e haplótipos acurados do gene HLA-B. A maioria dos SNPs são compartilhados entre todas as populações, enquanto o oposto é observado para os haplótipos e sequências de proteínas. No entanto, essas populações compartilham as mesmas regiões regulatórias. Além disso, a amostra brasileira introduziu novos alelos e aumentou a frequência de alelos raros que estavam presentes no 1000Genomes.HLA-B is possibly the most variable gene in the human genome, with almost eight different sequences described in the IPD-IMGT/HLA database. This gene encodes a key molecule for the presentation of the antigen to CD8 + T lymphocytes and modulation of NK cells. Despite its widespread study, most population-based studies of the HLA-B gene mainly focused on exons, ignoring intronic and regulatory sequences. Likewise, many of the studies used methods that detect only known variants, probably underestimating the variability of this gene. In this study, we use an appropriate computational method to assess the genetic variability of the complete HLA-B gene (including all exons, introns, and regulatory regions), using new generation sequencing data in 3,648 samples from 29 different world populations, in all levels: SNPs, haplotypes, complete sequences and encoded proteins. We detected 610 sites of variation along the HLA-B gene. Nucleotide diversity was high in exons 1, 2 and 3, and also in intron 1. The region between intron 3 and exon 7 is the most conserved, with low nucleotide diversity in exon 4 and with no variant in exon 6. We detected 535 complete HLA-B gene sequences and 191 coding sequences (exons only), which encode 171 distinct proteins. Our computational method proved to be effective in obtaining accurate genotypes and haplotypes of the HLA-B gene. Most SNPs are shared among all populations, while haplotypes and protein sequences are not. However, these populations share the same regulatory regions. Furthermore, the Brazilian sample introduced new alleles and increased the frequency of rare alleles that were present in 1000Genomes.Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)132202/2019-0Universidade Estadual Paulista (Unesp)Castelli, Erick da Cruz [UNESP]Universidade Estadual Paulista (Unesp)Silva, Nayane dos Santos Brito2021-05-28T20:46:35Z2021-05-28T20:46:35Z2021-04-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/20481933004064056P5porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-09-03T19:04:01Zoai:repositorio.unesp.br:11449/204819Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462024-09-03T19:04:01Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
Genetic diversity of the HLA-B gene in populations with different ancestry backgrounds.
title Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
spellingShingle Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
Silva, Nayane dos Santos Brito
HLA-B
Variabilidade
NGS
Brasil
Populações mundiais
1000Genomes
Variability
title_short Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
title_full Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
title_fullStr Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
title_full_unstemmed Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
title_sort Diversidade genética do gene HLA-B em populações com diferentes perfis de ancestralidade
author Silva, Nayane dos Santos Brito
author_facet Silva, Nayane dos Santos Brito
author_role author
dc.contributor.none.fl_str_mv Castelli, Erick da Cruz [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Silva, Nayane dos Santos Brito
dc.subject.por.fl_str_mv HLA-B
Variabilidade
NGS
Brasil
Populações mundiais
1000Genomes
Variability
topic HLA-B
Variabilidade
NGS
Brasil
Populações mundiais
1000Genomes
Variability
description O gene HLA-B é possivelmente o mais variável do genoma humano, com quase oito mil sequências diferentes descritas no banco de dados IPD-IMGT/HLA. Este gene codifica uma molécula fundamental para a apresentação do antígeno aos linfócitos T CD8 + e modulação das células NK. Embora largamente estudado, a maioria dos estudos avaliaram apenas éxons, geralmente negligenciando sequências intrônicas e regulatórias em um contexto populacional. Da mesma forma, muitos dos estudos utilizaram métodos que detectam apenas variantes conhecidas, provavelmente subestimando a variabilidade deste gene. Neste estudo utilizamos um método computacional adequado para avaliar a variabilidade genética do gene HLA-B completo (incluindo todos os éxons, íntrons e regiões regulatórias), a partir de dados de sequenciamento de nova geração em 3.648 amostras de 29 populações mundiais diferentes, em todos os níveis: SNPs, haplótipos, sequências completas e de proteínas codificadas. Foram detectados 610 sítios de variação ao longo do gene HLA-B. A diversidade nucleotídica foi alta nos éxons 1, 2 e 3, e também no íntron 1. A região entre o íntron 3 e o éxon 7 é a mais conservada, com baixa diversidade nucleotídica no éxon 4 e sem nenhuma variante no éxon 6. Detectamos 535 sequências completas do gene HLA-B e 191 sequências codificadoras (apenas éxons), as quais codificam 171 proteínas distintas. Nosso método computacional se mostrou eficaz na obtenção de genótipos e haplótipos acurados do gene HLA-B. A maioria dos SNPs são compartilhados entre todas as populações, enquanto o oposto é observado para os haplótipos e sequências de proteínas. No entanto, essas populações compartilham as mesmas regiões regulatórias. Além disso, a amostra brasileira introduziu novos alelos e aumentou a frequência de alelos raros que estavam presentes no 1000Genomes.
publishDate 2021
dc.date.none.fl_str_mv 2021-05-28T20:46:35Z
2021-05-28T20:46:35Z
2021-04-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/204819
33004064056P5
url http://hdl.handle.net/11449/204819
identifier_str_mv 33004064056P5
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1810021424617750528