Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/ |
Resumo: | Os marcadores STRs compreendem cerca de 3% do genoma humano. Uma estratégia para compreender melhor a constituição genética de uma população é estimar a distribuição das frequências alélicas de marcadores STRs. A técnica de PCR junto com a eletroforese capilar são, até hoje, as técnicas de escolha para a genotipagem de marcadores STR. As tecnologias de NGS revolucionaram as ciências biológicas, permitindo o sequenciamento simultâneo de muitas amostras de DNA ou RNA em um curto período de tempo. Com os avanços tecnológicos e a utilização cada vez mais frequente das técnicas de NGS surge a necessidade de testar a efetividade dessa técnica na genotipagem de marcadores STRs. Algumas ferramentas foram desenvolvidas para analisar estes marcadores a partir de dados de NGS, tais como STRait Razor, toaSTR, e HipSTR, entre outras. Existem vários projetos colaborativos internacionais como o Projeto Genoma Humano, o projeto 1000 genomas, o Human Genome Diversity Project (HGDP) entre outros, que disponibilizaram os dados de sequência dos indivíduos analisados, permitindo que estes genomas possam ser estudados com diferentes abordagens voltadas para o estudo da variação genética entre populações diferentes ao redor do mundo. Esse trabalho tem como hipótese que conjuntos de marcadores STRs utilizados para identificação humana e genotipados a partir de genomas completos seriam adequados para estudos de diversidade genética e estimativas de ancestralidade populacional e individual. O objetivo geral foi avaliar os níveis de diversidade e a estrutura genética de populações humanas de diferentes regiões biogeográficas por meio de conjuntos de marcadores STR genotipados com tecnologia de sequenciamento de nova geração. Foram estudados 22 marcadores autossômicos (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX e vWA) em amostra populacional do Estado de São Paulo e em genomas sequenciados no âmbito dos projetos 1000 Genomes e HGDP, utilizando três programas: HipSTR, STRait Razor e toaSTR. Observou-se elevada consistência e acurácia quando comparados os resultados obtidos pela utilização destas três ferramentas. Entretanto, o uso de mais de um software contribui para aumentar a acurácia na inferência de genótipos, principalmente nos marcadores (D21S11, Penta D, Penta E) em que se observou maiores taxas de erros. Com os genótipos obtidos, foi avaliada a diversidade genética entre populações de diferentes regiões biogeográficas e foi estimada a ancestralidade populacional de populações miscigenadas. O conjunto de marcadores STR aqui utilizados mostrou ser efetivos para estimar a estrutura populacional e a ancestralidade em níveis populacional e individual. Apesar da menor diversidade interpopulacional característica destes marcadores, os resultados obtidos se mostraram perfeitamente alinhados ao conhecimento pré-existente relacionado à história demográfica das populações estudadas. |
id |
USP_5035b27f435e2ae6c93fda87fc69e07a |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-05062023-114855 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completosGenetic diversity of global populations inferred by autosomal STRs used for human identification genotyped from complete genomesBioinformáticaBioinformaticsForensic geneticsGenética forenseMassively parallel sequencingMicrosatellitesMicrossatélitesRepetições curtas em tandemSequenciamento massivo em paraleloShort tandem repeatsOs marcadores STRs compreendem cerca de 3% do genoma humano. Uma estratégia para compreender melhor a constituição genética de uma população é estimar a distribuição das frequências alélicas de marcadores STRs. A técnica de PCR junto com a eletroforese capilar são, até hoje, as técnicas de escolha para a genotipagem de marcadores STR. As tecnologias de NGS revolucionaram as ciências biológicas, permitindo o sequenciamento simultâneo de muitas amostras de DNA ou RNA em um curto período de tempo. Com os avanços tecnológicos e a utilização cada vez mais frequente das técnicas de NGS surge a necessidade de testar a efetividade dessa técnica na genotipagem de marcadores STRs. Algumas ferramentas foram desenvolvidas para analisar estes marcadores a partir de dados de NGS, tais como STRait Razor, toaSTR, e HipSTR, entre outras. Existem vários projetos colaborativos internacionais como o Projeto Genoma Humano, o projeto 1000 genomas, o Human Genome Diversity Project (HGDP) entre outros, que disponibilizaram os dados de sequência dos indivíduos analisados, permitindo que estes genomas possam ser estudados com diferentes abordagens voltadas para o estudo da variação genética entre populações diferentes ao redor do mundo. Esse trabalho tem como hipótese que conjuntos de marcadores STRs utilizados para identificação humana e genotipados a partir de genomas completos seriam adequados para estudos de diversidade genética e estimativas de ancestralidade populacional e individual. O objetivo geral foi avaliar os níveis de diversidade e a estrutura genética de populações humanas de diferentes regiões biogeográficas por meio de conjuntos de marcadores STR genotipados com tecnologia de sequenciamento de nova geração. Foram estudados 22 marcadores autossômicos (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX e vWA) em amostra populacional do Estado de São Paulo e em genomas sequenciados no âmbito dos projetos 1000 Genomes e HGDP, utilizando três programas: HipSTR, STRait Razor e toaSTR. Observou-se elevada consistência e acurácia quando comparados os resultados obtidos pela utilização destas três ferramentas. Entretanto, o uso de mais de um software contribui para aumentar a acurácia na inferência de genótipos, principalmente nos marcadores (D21S11, Penta D, Penta E) em que se observou maiores taxas de erros. Com os genótipos obtidos, foi avaliada a diversidade genética entre populações de diferentes regiões biogeográficas e foi estimada a ancestralidade populacional de populações miscigenadas. O conjunto de marcadores STR aqui utilizados mostrou ser efetivos para estimar a estrutura populacional e a ancestralidade em níveis populacional e individual. Apesar da menor diversidade interpopulacional característica destes marcadores, os resultados obtidos se mostraram perfeitamente alinhados ao conhecimento pré-existente relacionado à história demográfica das populações estudadas.STR markers comprise about 3% of the human genome. One strategy to better understand the genetic make-up of a population is to estimate the distribution of allele frequencies of STR markers. The PCR technique together with capillary electrophoresis are, until today, the techniques of choice for genotyping STR markers. NGS technologies have revolutionized the biological sciences, allowing the simultaneous sequencing of many DNA or RNA samples in a short period of time. With technological advances and the increasingly frequent use of NGS techniques, there is a need to test the effectiveness of this technique in genotyping STR markers. Some tools have been developed to analyze these markers from NGS data, such as STRait Razor, toaSTR, and HipSTR, among others. There are several international collaborative projects such as the Human Genome Project, the 1000 Genomes Project, the Human Genome Diversity Project (HGDP) among others, which made available the sequence data of the analyzed individuals, allowing these genomes to be studied with different approaches aimed at studying the genetic variation among different populations around the world. The hypothesis of the present study is that sets of STR markers used for human identification and genotyped from complete genomes would be suitable for studies of genetic diversity and estimates of population and individual ancestry. The general objective was to evaluate the levels of diversity and the genetic structure of human populations from different biogeographical regions through sets of STR markers genotyped with next-generation sequencing technology. Twenty-two STR markers (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX, and vWA) were studied in a population sample from the State of São Paulo and in genomes sequenced within the scope of the 1000 Genomes and HGDP projects, using three programs: HipSTR, STRait Razor and toaSTR. High consistency and accuracy were observed when comparing the results obtained by using these three tools. However, the use of more than one software contributes to increase the accuracy in the inference of genotypes, mainly in the markers (D21S11, Penta D, Penta E) in which higher error rates were observed. With the genotypes obtained, the genetic diversity between populations from different biogeographical regions was evaluated and the population ancestry of mixed populations was estimated. The set of STR markers used here proved to be effective for estimating population structure and ancestry at population and individual levels. Despite the lower interpopulational diversity characteristic of these markers, the results obtained were perfectly aligned with the pre-existing knowledge related to the demographic history of the studied populations.Biblioteca Digitais de Teses e Dissertações da USPMendes Junior, Celso TeixeiraRecalde, Tamara Soledad Frontanilla2023-03-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-06-12T14:47:34Zoai:teses.usp.br:tde-05062023-114855Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-06-12T14:47:34Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos Genetic diversity of global populations inferred by autosomal STRs used for human identification genotyped from complete genomes |
title |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos |
spellingShingle |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos Recalde, Tamara Soledad Frontanilla Bioinformática Bioinformatics Forensic genetics Genética forense Massively parallel sequencing Microsatellites Microssatélites Repetições curtas em tandem Sequenciamento massivo em paralelo Short tandem repeats |
title_short |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos |
title_full |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos |
title_fullStr |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos |
title_full_unstemmed |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos |
title_sort |
Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos |
author |
Recalde, Tamara Soledad Frontanilla |
author_facet |
Recalde, Tamara Soledad Frontanilla |
author_role |
author |
dc.contributor.none.fl_str_mv |
Mendes Junior, Celso Teixeira |
dc.contributor.author.fl_str_mv |
Recalde, Tamara Soledad Frontanilla |
dc.subject.por.fl_str_mv |
Bioinformática Bioinformatics Forensic genetics Genética forense Massively parallel sequencing Microsatellites Microssatélites Repetições curtas em tandem Sequenciamento massivo em paralelo Short tandem repeats |
topic |
Bioinformática Bioinformatics Forensic genetics Genética forense Massively parallel sequencing Microsatellites Microssatélites Repetições curtas em tandem Sequenciamento massivo em paralelo Short tandem repeats |
description |
Os marcadores STRs compreendem cerca de 3% do genoma humano. Uma estratégia para compreender melhor a constituição genética de uma população é estimar a distribuição das frequências alélicas de marcadores STRs. A técnica de PCR junto com a eletroforese capilar são, até hoje, as técnicas de escolha para a genotipagem de marcadores STR. As tecnologias de NGS revolucionaram as ciências biológicas, permitindo o sequenciamento simultâneo de muitas amostras de DNA ou RNA em um curto período de tempo. Com os avanços tecnológicos e a utilização cada vez mais frequente das técnicas de NGS surge a necessidade de testar a efetividade dessa técnica na genotipagem de marcadores STRs. Algumas ferramentas foram desenvolvidas para analisar estes marcadores a partir de dados de NGS, tais como STRait Razor, toaSTR, e HipSTR, entre outras. Existem vários projetos colaborativos internacionais como o Projeto Genoma Humano, o projeto 1000 genomas, o Human Genome Diversity Project (HGDP) entre outros, que disponibilizaram os dados de sequência dos indivíduos analisados, permitindo que estes genomas possam ser estudados com diferentes abordagens voltadas para o estudo da variação genética entre populações diferentes ao redor do mundo. Esse trabalho tem como hipótese que conjuntos de marcadores STRs utilizados para identificação humana e genotipados a partir de genomas completos seriam adequados para estudos de diversidade genética e estimativas de ancestralidade populacional e individual. O objetivo geral foi avaliar os níveis de diversidade e a estrutura genética de populações humanas de diferentes regiões biogeográficas por meio de conjuntos de marcadores STR genotipados com tecnologia de sequenciamento de nova geração. Foram estudados 22 marcadores autossômicos (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX e vWA) em amostra populacional do Estado de São Paulo e em genomas sequenciados no âmbito dos projetos 1000 Genomes e HGDP, utilizando três programas: HipSTR, STRait Razor e toaSTR. Observou-se elevada consistência e acurácia quando comparados os resultados obtidos pela utilização destas três ferramentas. Entretanto, o uso de mais de um software contribui para aumentar a acurácia na inferência de genótipos, principalmente nos marcadores (D21S11, Penta D, Penta E) em que se observou maiores taxas de erros. Com os genótipos obtidos, foi avaliada a diversidade genética entre populações de diferentes regiões biogeográficas e foi estimada a ancestralidade populacional de populações miscigenadas. O conjunto de marcadores STR aqui utilizados mostrou ser efetivos para estimar a estrutura populacional e a ancestralidade em níveis populacional e individual. Apesar da menor diversidade interpopulacional característica destes marcadores, os resultados obtidos se mostraram perfeitamente alinhados ao conhecimento pré-existente relacionado à história demográfica das populações estudadas. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-03-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/ |
url |
https://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256696198529024 |