Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas

Detalhes bibliográficos
Autor(a) principal: Moraes, Vítor Matheus Soares
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/59/59138/tde-22112022-161656/
Resumo: A partir da introdução da PCR no final do século XX, tornou-se possível a análise dos Short Tandem Repeats, sendo até os dias de hoje o padrão para as análises periciais no âmbito de investigações policiais. Os marcadores mais abundantes no material genético humano são os polimorfismos de base única, chamados de SNPs, onde devido ao tamanho de seus amplicons, a possibilidade de trabalho com amostras degradadas demonstra uma vantagem em relação aos STRs. Porém, é necessária uma quantidade de aproximadamente 3 vezes mais marcadores, quando comparados aos microssatélites, para a obtenção de valores estatísticos viáveis para a utilização investigativa. Marcadores informativos de ancestralidade (AIMs) são polimorfismos que apresentam frequências alélicas elevadas em uma população e não em outras, sendo então utilizados para identificar as contribuições de ancestralidade genéticas individuais e populacionais de uma amostragem. São compostos por SNPs (AISNPs) em sua vasta maioria, podendo ser aplicados de maneira a identificar riscos epidemiológicos ou em investigações policiais. Apresentam também a possibilidade de uso para identificação humana em populações miscigenadas devido ao aumento da variabilidade genética. O objetivo do projeto é desenvolver dois painéis distintos que contenham entre 30-50 AIMs, para inferência de ancestralidade e para a identificação individual, para utilização na população brasileira e miscigenadas da américa latina utilizando 399 AIMs pertencentes aos painéis PIMA, SNPforID 34-plex, Kidd Lab set of 55 AISNPs, Seldin\'s 128 AIMs e Santos\'s 192 AIMs em amostra de 513 indivíduos da população de Ribeirão Preto - SP. As amostras foram sequenciadas a partir do sistema HaloPlex Enrichment System, e genotipados a partir do Infinium Multi-Ethnic Global-8 Array da Illumina. Posições que não estavam presentes em nenhum desses ensaios foram imputadas a partir de três ferramentas diferentes, o Sanger Imputation Server, o Michigan Imputation Server, e o Impute2, posteriormente mesclados a um único output. A inferência de ancestralidade foi realizada pra cada painel selecionado e para os dois painéis desenvolvidos e intitulados Painel Ancestralidade e Painel Identificação Humana, com as populações de referência europeias, africanas e asiáticas presentes no âmbito do 1000 Genomes Diversity Project (1KGEN) e do Human Genome Diversity Project (HGDP). As populações miscigenadas foram obtidas no âmbito do 1KGEN e as populações ameríndias no âmbito do HGDP. As inferências de ancestralidade foram realizadas a partir dos softwares Admix 95 e STRUCTURE. Os parâmetros forenses foram obtidos através do software STRAF e as estatísticas populacionais e genéticas a partir dos programas GenAlEx e Plink. As PCAs foram obtidas a partir da função prcomp nativa da linguagem R de programação. Apenas 3 posições não foram imputadas dos 399 selecionados, pertencentes ao painel de Seldin. Para as PCAs, observou-se que todos os painéis apresentaram poder para separação e de agrupamento de todas as populações referência analisadas, quando utilizadas as três primeiras componentes principais. As inferências de ancestralidade populacional para as populações miscigenadas no âmbito do 1KGEN demonstrou resultados muito semelhantes, independente do painel utilizado, e compatíveis com a referência obtidas a partir do GWAS em Martin et al. (2007). Para a população de Ribeirão Preto os resultados também se mostraram muito próximos da referência de Marcorin (2019), onde somente os painéis Kidd Lab set of 55 AISNPs e Ancestralidade superestimaram a ancestralidade AFR e subestimaram a ancestralidade EUR da amostragem, porém demonstrado como um desvio continuo a todas as amostras individuais pelo STRUCTURE. A amostra de Ribeirão Preto também se demonstrou melhor analisada quando a metodologia tetra-parental foi utilizada. O painel SNPforID 34-plex, quando utilizado em conjunto ao PIMA, e o Kidd Lab set of 55 AISNPs, demonstraram parâmetros forenses com informatividade próximas aos dos 13 STRs do CODIS e do SNPforID 52-plex, quando aplicados na amostra brasileira. O Painel Identificação Humana demonstrou resultados superiores a estes dois painéis, apresentando informatividade próxima a dos 20 STRs do CODIS. Ambos os painéis desenvolvidos neste projeto apresentaram viabilidade de utilização para inferência de ancestralidade e identificação humana na américa latina.
id USP_d77fb021a60161cbb64435e35762ccec
oai_identifier_str oai:teses.usp.br:tde-22112022-161656
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadasUse of ancestry informative markers for the development of panels for ancestry inference and human identification in mixed populationsAncestralidadeAncestryForensic geneticsGenética forenseHuman identificationIdentificação humanaImputaçãoImputationPolimorfismos de nucleotídeo únicoSingle nucleotide polymorphismsA partir da introdução da PCR no final do século XX, tornou-se possível a análise dos Short Tandem Repeats, sendo até os dias de hoje o padrão para as análises periciais no âmbito de investigações policiais. Os marcadores mais abundantes no material genético humano são os polimorfismos de base única, chamados de SNPs, onde devido ao tamanho de seus amplicons, a possibilidade de trabalho com amostras degradadas demonstra uma vantagem em relação aos STRs. Porém, é necessária uma quantidade de aproximadamente 3 vezes mais marcadores, quando comparados aos microssatélites, para a obtenção de valores estatísticos viáveis para a utilização investigativa. Marcadores informativos de ancestralidade (AIMs) são polimorfismos que apresentam frequências alélicas elevadas em uma população e não em outras, sendo então utilizados para identificar as contribuições de ancestralidade genéticas individuais e populacionais de uma amostragem. São compostos por SNPs (AISNPs) em sua vasta maioria, podendo ser aplicados de maneira a identificar riscos epidemiológicos ou em investigações policiais. Apresentam também a possibilidade de uso para identificação humana em populações miscigenadas devido ao aumento da variabilidade genética. O objetivo do projeto é desenvolver dois painéis distintos que contenham entre 30-50 AIMs, para inferência de ancestralidade e para a identificação individual, para utilização na população brasileira e miscigenadas da américa latina utilizando 399 AIMs pertencentes aos painéis PIMA, SNPforID 34-plex, Kidd Lab set of 55 AISNPs, Seldin\'s 128 AIMs e Santos\'s 192 AIMs em amostra de 513 indivíduos da população de Ribeirão Preto - SP. As amostras foram sequenciadas a partir do sistema HaloPlex Enrichment System, e genotipados a partir do Infinium Multi-Ethnic Global-8 Array da Illumina. Posições que não estavam presentes em nenhum desses ensaios foram imputadas a partir de três ferramentas diferentes, o Sanger Imputation Server, o Michigan Imputation Server, e o Impute2, posteriormente mesclados a um único output. A inferência de ancestralidade foi realizada pra cada painel selecionado e para os dois painéis desenvolvidos e intitulados Painel Ancestralidade e Painel Identificação Humana, com as populações de referência europeias, africanas e asiáticas presentes no âmbito do 1000 Genomes Diversity Project (1KGEN) e do Human Genome Diversity Project (HGDP). As populações miscigenadas foram obtidas no âmbito do 1KGEN e as populações ameríndias no âmbito do HGDP. As inferências de ancestralidade foram realizadas a partir dos softwares Admix 95 e STRUCTURE. Os parâmetros forenses foram obtidos através do software STRAF e as estatísticas populacionais e genéticas a partir dos programas GenAlEx e Plink. As PCAs foram obtidas a partir da função prcomp nativa da linguagem R de programação. Apenas 3 posições não foram imputadas dos 399 selecionados, pertencentes ao painel de Seldin. Para as PCAs, observou-se que todos os painéis apresentaram poder para separação e de agrupamento de todas as populações referência analisadas, quando utilizadas as três primeiras componentes principais. As inferências de ancestralidade populacional para as populações miscigenadas no âmbito do 1KGEN demonstrou resultados muito semelhantes, independente do painel utilizado, e compatíveis com a referência obtidas a partir do GWAS em Martin et al. (2007). Para a população de Ribeirão Preto os resultados também se mostraram muito próximos da referência de Marcorin (2019), onde somente os painéis Kidd Lab set of 55 AISNPs e Ancestralidade superestimaram a ancestralidade AFR e subestimaram a ancestralidade EUR da amostragem, porém demonstrado como um desvio continuo a todas as amostras individuais pelo STRUCTURE. A amostra de Ribeirão Preto também se demonstrou melhor analisada quando a metodologia tetra-parental foi utilizada. O painel SNPforID 34-plex, quando utilizado em conjunto ao PIMA, e o Kidd Lab set of 55 AISNPs, demonstraram parâmetros forenses com informatividade próximas aos dos 13 STRs do CODIS e do SNPforID 52-plex, quando aplicados na amostra brasileira. O Painel Identificação Humana demonstrou resultados superiores a estes dois painéis, apresentando informatividade próxima a dos 20 STRs do CODIS. Ambos os painéis desenvolvidos neste projeto apresentaram viabilidade de utilização para inferência de ancestralidade e identificação humana na américa latina.Since the introduction of PCR at the end of the 20th century, the analysis of Short Tandem Repeats became possible, which is still the standard for expert analysis in the context of police investigations. The most abundant markers in human genetic material are single-base polymorphisms, SNPs, where, due to the size of their amplicons, the possibility of working with degraded samples demonstrates an advantage over STRs. However, an amount of approximately 3 times more markers is required, when compared to microsatellites, to obtain viable statistical values for investigative use. Ancestry informational markers (AIMs) are polymorphisms that present high allele frequencies in one population and not in others, and are used to identify the individual and population genetic ancestry contributions of a sample. The vast majority are composed of SNPs (AISNPs) and can be applied in order to identify epidemiological risks or in police investigations. They also present the possibility of use for human identification in mixed populations due to the increase in genetic variability. The objective of the project is to develop two distinct panels ranging from 30 to 50 AIMs, to infer ancestry and for individual identification, which could be used in the Brazilian and admixed population of Latin America, using 399 AIMs belonging to the PIMA, SNPforID 34-plex, Kidd Lab set of 55 AISNPs, Seldin\'s 128 AIMs and Santos\'s 192 AIMs panels in a sample of 513 individuals from the population of Ribeirão Preto - SP. Samples were sequenced using the HaloPlex Enrichment System, and genotyped using the Illumina Infinium Multi-Ethnic Global-8 Array. Positions that were not present in any of these tests were imputed using three different tools, Sanger Imputation Server, Michigan Imputation Server, and Impute2, later merged into a single output. Ancestry inference was performed for each selected panel and for the two panels developed and entitled Painel Ancestralidade and Painel Identificação Humana, with European, African and Asian reference populations present within the scope of the 1000 Genome Diversity Project (1KGEN) and the Human Genome Diversity Project (HGDP). The admixed populations were obtained under the 1KGEN and the Amerindian populations under the HGDP. Ancestry inferences were performed using Admix 95 and STRUCTURE software. The forensic parameters were obtained through the STRAF software and the population and genetic statistics from the GenAlEx and Plink software. The PCAs were obtained from the prcomp function native to the R programming language. Only 3 positions were not assigned from the 399 selected, belonging to Seldin\'s panel. For PCAs, it was observed that all panels showed power for separation and grouping of all reference populations analyzed, when using the first three main components. Population ancestry inferences for mixed populations under 1KGEN showed very similar results, regardless of the panel used, and consistent with the reference obtained from the GWAS in Martin et al. (2007). For the population of Ribeirão Preto, the results were also very close to the reference by Marcorin (2019), where only the Kidd Lab set of 55 AISNPs and Painel Ancestralidade overestimated the AFR ancestry and underestimated the EUR ancestry of the sample, but demonstrated as a continue deviation to all individual samples by STRUCTURE. The sample from Ribeirão Preto was also better analyzed when the tetra-parental methodology was used. The SNPforID 34-plex panel, when used together with PIMA, and the Kidd Lab set of 55 AISNPs, demonstrated forensic parameters with informativeness close to those of the 13 CODIS STRs and the SNPforID 52-plex, when applied to the Brazilian sample. The Painel Identificação Humana showed superior results to these two panels, presenting informativity close to that of the 20 CODIS STRs. Both panels developed in this project showed feasibility of use for inference of ancestry and human identification in Latin America.Biblioteca Digitais de Teses e Dissertações da USPMendes Junior, Celso TeixeiraMoraes, Vítor Matheus Soares2022-09-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59138/tde-22112022-161656/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-11-24T15:19:05Zoai:teses.usp.br:tde-22112022-161656Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-11-24T15:19:05Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
Use of ancestry informative markers for the development of panels for ancestry inference and human identification in mixed populations
title Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
spellingShingle Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
Moraes, Vítor Matheus Soares
Ancestralidade
Ancestry
Forensic genetics
Genética forense
Human identification
Identificação humana
Imputação
Imputation
Polimorfismos de nucleotídeo único
Single nucleotide polymorphisms
title_short Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
title_full Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
title_fullStr Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
title_full_unstemmed Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
title_sort Uso de marcadores informativos de ancestralidade para desenvolvimento de painéis de inferência de ancestralidade e identificação humana em populações miscigenadas
author Moraes, Vítor Matheus Soares
author_facet Moraes, Vítor Matheus Soares
author_role author
dc.contributor.none.fl_str_mv Mendes Junior, Celso Teixeira
dc.contributor.author.fl_str_mv Moraes, Vítor Matheus Soares
dc.subject.por.fl_str_mv Ancestralidade
Ancestry
Forensic genetics
Genética forense
Human identification
Identificação humana
Imputação
Imputation
Polimorfismos de nucleotídeo único
Single nucleotide polymorphisms
topic Ancestralidade
Ancestry
Forensic genetics
Genética forense
Human identification
Identificação humana
Imputação
Imputation
Polimorfismos de nucleotídeo único
Single nucleotide polymorphisms
description A partir da introdução da PCR no final do século XX, tornou-se possível a análise dos Short Tandem Repeats, sendo até os dias de hoje o padrão para as análises periciais no âmbito de investigações policiais. Os marcadores mais abundantes no material genético humano são os polimorfismos de base única, chamados de SNPs, onde devido ao tamanho de seus amplicons, a possibilidade de trabalho com amostras degradadas demonstra uma vantagem em relação aos STRs. Porém, é necessária uma quantidade de aproximadamente 3 vezes mais marcadores, quando comparados aos microssatélites, para a obtenção de valores estatísticos viáveis para a utilização investigativa. Marcadores informativos de ancestralidade (AIMs) são polimorfismos que apresentam frequências alélicas elevadas em uma população e não em outras, sendo então utilizados para identificar as contribuições de ancestralidade genéticas individuais e populacionais de uma amostragem. São compostos por SNPs (AISNPs) em sua vasta maioria, podendo ser aplicados de maneira a identificar riscos epidemiológicos ou em investigações policiais. Apresentam também a possibilidade de uso para identificação humana em populações miscigenadas devido ao aumento da variabilidade genética. O objetivo do projeto é desenvolver dois painéis distintos que contenham entre 30-50 AIMs, para inferência de ancestralidade e para a identificação individual, para utilização na população brasileira e miscigenadas da américa latina utilizando 399 AIMs pertencentes aos painéis PIMA, SNPforID 34-plex, Kidd Lab set of 55 AISNPs, Seldin\'s 128 AIMs e Santos\'s 192 AIMs em amostra de 513 indivíduos da população de Ribeirão Preto - SP. As amostras foram sequenciadas a partir do sistema HaloPlex Enrichment System, e genotipados a partir do Infinium Multi-Ethnic Global-8 Array da Illumina. Posições que não estavam presentes em nenhum desses ensaios foram imputadas a partir de três ferramentas diferentes, o Sanger Imputation Server, o Michigan Imputation Server, e o Impute2, posteriormente mesclados a um único output. A inferência de ancestralidade foi realizada pra cada painel selecionado e para os dois painéis desenvolvidos e intitulados Painel Ancestralidade e Painel Identificação Humana, com as populações de referência europeias, africanas e asiáticas presentes no âmbito do 1000 Genomes Diversity Project (1KGEN) e do Human Genome Diversity Project (HGDP). As populações miscigenadas foram obtidas no âmbito do 1KGEN e as populações ameríndias no âmbito do HGDP. As inferências de ancestralidade foram realizadas a partir dos softwares Admix 95 e STRUCTURE. Os parâmetros forenses foram obtidos através do software STRAF e as estatísticas populacionais e genéticas a partir dos programas GenAlEx e Plink. As PCAs foram obtidas a partir da função prcomp nativa da linguagem R de programação. Apenas 3 posições não foram imputadas dos 399 selecionados, pertencentes ao painel de Seldin. Para as PCAs, observou-se que todos os painéis apresentaram poder para separação e de agrupamento de todas as populações referência analisadas, quando utilizadas as três primeiras componentes principais. As inferências de ancestralidade populacional para as populações miscigenadas no âmbito do 1KGEN demonstrou resultados muito semelhantes, independente do painel utilizado, e compatíveis com a referência obtidas a partir do GWAS em Martin et al. (2007). Para a população de Ribeirão Preto os resultados também se mostraram muito próximos da referência de Marcorin (2019), onde somente os painéis Kidd Lab set of 55 AISNPs e Ancestralidade superestimaram a ancestralidade AFR e subestimaram a ancestralidade EUR da amostragem, porém demonstrado como um desvio continuo a todas as amostras individuais pelo STRUCTURE. A amostra de Ribeirão Preto também se demonstrou melhor analisada quando a metodologia tetra-parental foi utilizada. O painel SNPforID 34-plex, quando utilizado em conjunto ao PIMA, e o Kidd Lab set of 55 AISNPs, demonstraram parâmetros forenses com informatividade próximas aos dos 13 STRs do CODIS e do SNPforID 52-plex, quando aplicados na amostra brasileira. O Painel Identificação Humana demonstrou resultados superiores a estes dois painéis, apresentando informatividade próxima a dos 20 STRs do CODIS. Ambos os painéis desenvolvidos neste projeto apresentaram viabilidade de utilização para inferência de ancestralidade e identificação humana na américa latina.
publishDate 2022
dc.date.none.fl_str_mv 2022-09-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/59/59138/tde-22112022-161656/
url https://www.teses.usp.br/teses/disponiveis/59/59138/tde-22112022-161656/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257288108146688