Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção
Autor(a) principal: | |
---|---|
Data de Publicação: | 2011 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/41/41131/tde-26102011-092404/ |
Resumo: | A comparação de taxas de substituição não-sinônimas (dN) e sinônimas (dS) permite inferir quais regimes de seleção operaram sobre regiões codificadoras. Genes com d>N/dS > 1 são candidatos a estarem sob seleção positiva, e scans genômicos em busca dessa assinatura se revelaram uma ferramenta poderosa. Trata-se de um método robusto, uma vez que assume-se que tais sítios estão intercalados nas regiões do genoma sob estudo (e portanto partilham a mesma história demográfica), e que têm como foco a variação em genes específicos, eliminando ambiguidades acerca do alvo da seleção. Por outro lado, o critério de ω > 1 para que genes estejam sob seleção positiva é muito conservador. Isso ocorre porque geralmente apenas alguns códons estão sob seleção positiva, enquanto a maior parte das mutações não-sinônimas são deletérias e, portanto, estão sob seleção purificadora. Por isso, convencionou-se analisar subconjuntos de códons em busca de seleção, seja através de uma base de dados mais restrita ou através de modelos que estimam diferentes valores de ω para subconjuntos de códons, tornando possível inferir quais deles estão sob seleção positiva. Os genes das moléculas MHC têm vários padrões de variação que indicam que algum tipo de seleção balanceadora atuou sobre eles (alta diversidade, grande diferenciação entre alelos e a existência de polimorfismos trans-específicos). Os genes HLA constituem um subconjunto de genes do MHC humano e estão localizados no braço curto do cromossomo 6. Os genes clássicos de classe I (HLA-A, HLA-B e HLA-C) são expressos na maior parte das células somáticas e desempenham papel central no processo de resposta imune adaptativa, capturando e apresentando peptídeos na superfície celular. A região da molécula de MHC à qual antígenos são ligados para serem apresentados a linfócitos T, dessa forma iniciando a resposta imune adaptativa, é conhecida como sítio de reconhecimento do antígeno (ARS). É bem estabelecido que os códons ARS apresentam taxas de substituição não-sinônimas maiores que as taxas sinônimas para esses três locos, consistente com um efeito de seleção balanceadora levando a maior variabilidade funcional na região da molécula que interage com o peptídeo. Os genes HLA clássicos apresentam centenas de alelos, e esses constituem clados que reúnem alelos filogeneticamente relacionados e com similaridades funcionais. Apesar de não haver controvérsia sobre a existência de seleção sobre genes HLA, não existe consenso acerca da importância relativa da seleção sobre linhagens alélicas e sobre alelos individuais na diversificação dos alelos de HLA, e essa foi a questão que decidimos investigar. Nossa hipótese nula foi a de que as linhagens foram os alvos da seleção e a hipótese alternativa foi a de que os alelos individuais foram alvos da seleção ao longo da história evolutiva dos genes HLA. Buscamos, primeiramente, fazer uma validação do método de inferência de dN/dS usando como estudo de caso os códons ARS e sua relação com a capacidade de inferência. Constatamos que, dos códons que encontramos sob seleção positiva, todos (exceto um) estão também na classificação clássica dos códons ARS ou a ±1 códon de distância destes, mostrando que existem evidências de seleção em sítios vizinhos aos ARS. Portanto, uma classificação expandida, que inclua os códons sob seleção que não estão nas classificações ARS comumente utilizadas, deveria aumentar o poder estatístico de testes de modelos de seleção nos genes HLA. Ao comparar os resultados obtidos em análises filogenéticas com bases de dados com e sem recombinantes, verificamos que a remoção de alelos recombinantes altera as estimativas de parâmetros, a identificação de códons com evidência de seleção e a significância dos testes de comparação de modelos. Nossas análises mostraram que ω é significativamente maior para pares de alelos de linhagens diferentes do que para pares de alelos de uma mesma linhagem e que existe uma correlação positiva significativa entre o tempo de divergência dos alelos e as estimativas de ω. Verificamos, ainda, que é possível rejeitar um modelo nulo de uma razão ω estimada para todos os ramos da árvore filogenética e favorecer um modelo em que ω é estimado separadamente para ramos entre e intra-linhagens em HLA-C. Em HLA-A e HLA-C, ω é significativamente > 1 entre linhagens. Mostramos também, para os mesmos locos, ω é significativamente > 1 nos ramos internos. Em HLA-C, o modelo que estima ω separadamente para ramos internos e terminais foi favorecido. Nossos resultados mostram que a intensidade de seleção atuando entre linhagens é maior do que aquela dentro de linhagens. Entretanto, mesmo dentro de linhagens, há fortes evidências de desvios de neutralidade, sugerindo a ação da seleção natural. |
id |
USP_96d659cb84e8cf21ef1a6ffffc1a8793 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-26102011-092404 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleçãoNatural selection on HLA genes: a molecular investigation of the location and timing of selection eventsdN/dSdN/dSEvolução molecularHLAHLAMolecular evolutionA comparação de taxas de substituição não-sinônimas (dN) e sinônimas (dS) permite inferir quais regimes de seleção operaram sobre regiões codificadoras. Genes com d>N/dS > 1 são candidatos a estarem sob seleção positiva, e scans genômicos em busca dessa assinatura se revelaram uma ferramenta poderosa. Trata-se de um método robusto, uma vez que assume-se que tais sítios estão intercalados nas regiões do genoma sob estudo (e portanto partilham a mesma história demográfica), e que têm como foco a variação em genes específicos, eliminando ambiguidades acerca do alvo da seleção. Por outro lado, o critério de ω > 1 para que genes estejam sob seleção positiva é muito conservador. Isso ocorre porque geralmente apenas alguns códons estão sob seleção positiva, enquanto a maior parte das mutações não-sinônimas são deletérias e, portanto, estão sob seleção purificadora. Por isso, convencionou-se analisar subconjuntos de códons em busca de seleção, seja através de uma base de dados mais restrita ou através de modelos que estimam diferentes valores de ω para subconjuntos de códons, tornando possível inferir quais deles estão sob seleção positiva. Os genes das moléculas MHC têm vários padrões de variação que indicam que algum tipo de seleção balanceadora atuou sobre eles (alta diversidade, grande diferenciação entre alelos e a existência de polimorfismos trans-específicos). Os genes HLA constituem um subconjunto de genes do MHC humano e estão localizados no braço curto do cromossomo 6. Os genes clássicos de classe I (HLA-A, HLA-B e HLA-C) são expressos na maior parte das células somáticas e desempenham papel central no processo de resposta imune adaptativa, capturando e apresentando peptídeos na superfície celular. A região da molécula de MHC à qual antígenos são ligados para serem apresentados a linfócitos T, dessa forma iniciando a resposta imune adaptativa, é conhecida como sítio de reconhecimento do antígeno (ARS). É bem estabelecido que os códons ARS apresentam taxas de substituição não-sinônimas maiores que as taxas sinônimas para esses três locos, consistente com um efeito de seleção balanceadora levando a maior variabilidade funcional na região da molécula que interage com o peptídeo. Os genes HLA clássicos apresentam centenas de alelos, e esses constituem clados que reúnem alelos filogeneticamente relacionados e com similaridades funcionais. Apesar de não haver controvérsia sobre a existência de seleção sobre genes HLA, não existe consenso acerca da importância relativa da seleção sobre linhagens alélicas e sobre alelos individuais na diversificação dos alelos de HLA, e essa foi a questão que decidimos investigar. Nossa hipótese nula foi a de que as linhagens foram os alvos da seleção e a hipótese alternativa foi a de que os alelos individuais foram alvos da seleção ao longo da história evolutiva dos genes HLA. Buscamos, primeiramente, fazer uma validação do método de inferência de dN/dS usando como estudo de caso os códons ARS e sua relação com a capacidade de inferência. Constatamos que, dos códons que encontramos sob seleção positiva, todos (exceto um) estão também na classificação clássica dos códons ARS ou a ±1 códon de distância destes, mostrando que existem evidências de seleção em sítios vizinhos aos ARS. Portanto, uma classificação expandida, que inclua os códons sob seleção que não estão nas classificações ARS comumente utilizadas, deveria aumentar o poder estatístico de testes de modelos de seleção nos genes HLA. Ao comparar os resultados obtidos em análises filogenéticas com bases de dados com e sem recombinantes, verificamos que a remoção de alelos recombinantes altera as estimativas de parâmetros, a identificação de códons com evidência de seleção e a significância dos testes de comparação de modelos. Nossas análises mostraram que ω é significativamente maior para pares de alelos de linhagens diferentes do que para pares de alelos de uma mesma linhagem e que existe uma correlação positiva significativa entre o tempo de divergência dos alelos e as estimativas de ω. Verificamos, ainda, que é possível rejeitar um modelo nulo de uma razão ω estimada para todos os ramos da árvore filogenética e favorecer um modelo em que ω é estimado separadamente para ramos entre e intra-linhagens em HLA-C. Em HLA-A e HLA-C, ω é significativamente > 1 entre linhagens. Mostramos também, para os mesmos locos, ω é significativamente > 1 nos ramos internos. Em HLA-C, o modelo que estima ω separadamente para ramos internos e terminais foi favorecido. Nossos resultados mostram que a intensidade de seleção atuando entre linhagens é maior do que aquela dentro de linhagens. Entretanto, mesmo dentro de linhagens, há fortes evidências de desvios de neutralidade, sugerindo a ação da seleção natural.The comparison of non-synonymous (dN) and synonymous (dS) substitution rates allows us to infer selection schemes which operated in coding regions. Genes with dN/dS > 1 are candidates to be under positive selection, and genome scans in search for this signature have proved to be a powerful tool. It is a robust method, since it is assumed that such sites are interspersed in regions of the genome under study (and therefore share the same demographic history), and which focuses on the variation in specific genes, eliminating ambiguities about the target of selection. On the other hand, the criterion of ω > 1 for genes to be considered under positive selection is very conservative. This is because usually only a few codons are under positive selection, while most non-synonymous mutations are deleterious and are thus under purifying selection. Therefore, it has been conventioned to analyze subsets of codons in search of selection, either through a narrower data set or through models that calculate different ω values for subsets of codons, making it possible to infer which of them are under positive selection. The MHC molecules genes have different variation patterns that indicate some sort of balancing selection acted upon them (high diversity, large differentiation between alleles and the existence of trans-specific polymorphisms). HLA genes are a subset of human MHC genes and are located on the short arm of chromosome 6. The classical class I genes (HLA-A, HLA-B and HLA-C) are expressed in most somatic cells and play a central role in the process of adaptive immune response, capturing and presenting peptides on the cell surface. The region of the MHC molecule to which antigens are bound to be presented to T lymphocytes, thereby initiating the adaptive immune response, is known as the antigen recognition site (ARS). It is well established that ARS codons have higher non-synonymous than synonymous substitution rates on these three loci, consistent with an effect of balancing selection leading to greater variability in the functional region of the molecule that interacts with the peptide. The classical HLA genes have hundreds of alleles, and these constitute clades which group phylogenetically related and functionally similar alleles. Although there is no controversy about the existence of selection acting on HLA genes, there is no consensus on the relative importance of selection on allelic lineages and on individual alleles on the diversification of HLA alleles, and that was the question we decided to investigate. Our null hypothesis was that lineages were targets of selection and the alternative hypothesis was that the individual alleles were targets of selection during the evolutionary history of HLA genes. We sought, first, to make a validation of the method of inference dN/d>S using as a case study the ARS codons and their relation to the ability of inference. Of all the codons under selection we found, all (except one) are also in the classification of classical ARS codons or ±1 codon away from these, showing that there is evidence of selection at nearby sites to the ARS. Therefore, an expanded classification, which includes the codons under selection that are not commonly used in the ARS classifications, should increase the statistical power of selecion model tests on the HLA genes. By comparing the results obtained in phylogenetic analysis using data sets with or without recombinants, we found that the removal of recombinant alleles alters the parameter estimates, the identification of codons with evidence of selection and the significance of model comparison tests. Our analysis showed that ω is significantly higher for pairs of alleles from different lineages than for pairs of alleles from the same lineage and that there is a significant positive correlation between time of divergence of alleles and estimates of ω. We also verified that it is possible to reject a null model of one ω estimated for all branches of the phylogenetic tree and favor a model where ω is estimated separately for branches within and between lineages of HLA-C. In HLA-A and HLA-C, ω is significantly > 1 between lineages. We also show that, for these same loci, ω fis significantly greater than one or internal branches. In HLA-C, the model that estimates ω separately for terminal and internal branches was favored. Our results show that the intensity of selection between lineages is greater then within them. However, even within lineages, there is a strong evidence of deviation from neutrality, suggesting the action of natural selection.Biblioteca Digitais de Teses e Dissertações da USPMeyer, DiogoBitarello, Bárbara Domingues2011-08-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/41/41131/tde-26102011-092404/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:10:30Zoai:teses.usp.br:tde-26102011-092404Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:10:30Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção Natural selection on HLA genes: a molecular investigation of the location and timing of selection events |
title |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção |
spellingShingle |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção Bitarello, Bárbara Domingues dN/dS dN/dS Evolução molecular HLA HLA Molecular evolution |
title_short |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção |
title_full |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção |
title_fullStr |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção |
title_full_unstemmed |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção |
title_sort |
Seleção natural em genes HLA: uma investigação da localização molecular e temporal dos eventos de seleção |
author |
Bitarello, Bárbara Domingues |
author_facet |
Bitarello, Bárbara Domingues |
author_role |
author |
dc.contributor.none.fl_str_mv |
Meyer, Diogo |
dc.contributor.author.fl_str_mv |
Bitarello, Bárbara Domingues |
dc.subject.por.fl_str_mv |
dN/dS dN/dS Evolução molecular HLA HLA Molecular evolution |
topic |
dN/dS dN/dS Evolução molecular HLA HLA Molecular evolution |
description |
A comparação de taxas de substituição não-sinônimas (dN) e sinônimas (dS) permite inferir quais regimes de seleção operaram sobre regiões codificadoras. Genes com d>N/dS > 1 são candidatos a estarem sob seleção positiva, e scans genômicos em busca dessa assinatura se revelaram uma ferramenta poderosa. Trata-se de um método robusto, uma vez que assume-se que tais sítios estão intercalados nas regiões do genoma sob estudo (e portanto partilham a mesma história demográfica), e que têm como foco a variação em genes específicos, eliminando ambiguidades acerca do alvo da seleção. Por outro lado, o critério de ω > 1 para que genes estejam sob seleção positiva é muito conservador. Isso ocorre porque geralmente apenas alguns códons estão sob seleção positiva, enquanto a maior parte das mutações não-sinônimas são deletérias e, portanto, estão sob seleção purificadora. Por isso, convencionou-se analisar subconjuntos de códons em busca de seleção, seja através de uma base de dados mais restrita ou através de modelos que estimam diferentes valores de ω para subconjuntos de códons, tornando possível inferir quais deles estão sob seleção positiva. Os genes das moléculas MHC têm vários padrões de variação que indicam que algum tipo de seleção balanceadora atuou sobre eles (alta diversidade, grande diferenciação entre alelos e a existência de polimorfismos trans-específicos). Os genes HLA constituem um subconjunto de genes do MHC humano e estão localizados no braço curto do cromossomo 6. Os genes clássicos de classe I (HLA-A, HLA-B e HLA-C) são expressos na maior parte das células somáticas e desempenham papel central no processo de resposta imune adaptativa, capturando e apresentando peptídeos na superfície celular. A região da molécula de MHC à qual antígenos são ligados para serem apresentados a linfócitos T, dessa forma iniciando a resposta imune adaptativa, é conhecida como sítio de reconhecimento do antígeno (ARS). É bem estabelecido que os códons ARS apresentam taxas de substituição não-sinônimas maiores que as taxas sinônimas para esses três locos, consistente com um efeito de seleção balanceadora levando a maior variabilidade funcional na região da molécula que interage com o peptídeo. Os genes HLA clássicos apresentam centenas de alelos, e esses constituem clados que reúnem alelos filogeneticamente relacionados e com similaridades funcionais. Apesar de não haver controvérsia sobre a existência de seleção sobre genes HLA, não existe consenso acerca da importância relativa da seleção sobre linhagens alélicas e sobre alelos individuais na diversificação dos alelos de HLA, e essa foi a questão que decidimos investigar. Nossa hipótese nula foi a de que as linhagens foram os alvos da seleção e a hipótese alternativa foi a de que os alelos individuais foram alvos da seleção ao longo da história evolutiva dos genes HLA. Buscamos, primeiramente, fazer uma validação do método de inferência de dN/dS usando como estudo de caso os códons ARS e sua relação com a capacidade de inferência. Constatamos que, dos códons que encontramos sob seleção positiva, todos (exceto um) estão também na classificação clássica dos códons ARS ou a ±1 códon de distância destes, mostrando que existem evidências de seleção em sítios vizinhos aos ARS. Portanto, uma classificação expandida, que inclua os códons sob seleção que não estão nas classificações ARS comumente utilizadas, deveria aumentar o poder estatístico de testes de modelos de seleção nos genes HLA. Ao comparar os resultados obtidos em análises filogenéticas com bases de dados com e sem recombinantes, verificamos que a remoção de alelos recombinantes altera as estimativas de parâmetros, a identificação de códons com evidência de seleção e a significância dos testes de comparação de modelos. Nossas análises mostraram que ω é significativamente maior para pares de alelos de linhagens diferentes do que para pares de alelos de uma mesma linhagem e que existe uma correlação positiva significativa entre o tempo de divergência dos alelos e as estimativas de ω. Verificamos, ainda, que é possível rejeitar um modelo nulo de uma razão ω estimada para todos os ramos da árvore filogenética e favorecer um modelo em que ω é estimado separadamente para ramos entre e intra-linhagens em HLA-C. Em HLA-A e HLA-C, ω é significativamente > 1 entre linhagens. Mostramos também, para os mesmos locos, ω é significativamente > 1 nos ramos internos. Em HLA-C, o modelo que estima ω separadamente para ramos internos e terminais foi favorecido. Nossos resultados mostram que a intensidade de seleção atuando entre linhagens é maior do que aquela dentro de linhagens. Entretanto, mesmo dentro de linhagens, há fortes evidências de desvios de neutralidade, sugerindo a ação da seleção natural. |
publishDate |
2011 |
dc.date.none.fl_str_mv |
2011-08-05 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/41/41131/tde-26102011-092404/ |
url |
http://www.teses.usp.br/teses/disponiveis/41/41131/tde-26102011-092404/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257404984524800 |