Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos

Detalhes bibliográficos
Autor(a) principal: Recalde, Tamara Soledad Frontanilla
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/
Resumo: Os marcadores STRs compreendem cerca de 3% do genoma humano. Uma estratégia para compreender melhor a constituição genética de uma população é estimar a distribuição das frequências alélicas de marcadores STRs. A técnica de PCR junto com a eletroforese capilar são, até hoje, as técnicas de escolha para a genotipagem de marcadores STR. As tecnologias de NGS revolucionaram as ciências biológicas, permitindo o sequenciamento simultâneo de muitas amostras de DNA ou RNA em um curto período de tempo. Com os avanços tecnológicos e a utilização cada vez mais frequente das técnicas de NGS surge a necessidade de testar a efetividade dessa técnica na genotipagem de marcadores STRs. Algumas ferramentas foram desenvolvidas para analisar estes marcadores a partir de dados de NGS, tais como STRait Razor, toaSTR, e HipSTR, entre outras. Existem vários projetos colaborativos internacionais como o Projeto Genoma Humano, o projeto 1000 genomas, o Human Genome Diversity Project (HGDP) entre outros, que disponibilizaram os dados de sequência dos indivíduos analisados, permitindo que estes genomas possam ser estudados com diferentes abordagens voltadas para o estudo da variação genética entre populações diferentes ao redor do mundo. Esse trabalho tem como hipótese que conjuntos de marcadores STRs utilizados para identificação humana e genotipados a partir de genomas completos seriam adequados para estudos de diversidade genética e estimativas de ancestralidade populacional e individual. O objetivo geral foi avaliar os níveis de diversidade e a estrutura genética de populações humanas de diferentes regiões biogeográficas por meio de conjuntos de marcadores STR genotipados com tecnologia de sequenciamento de nova geração. Foram estudados 22 marcadores autossômicos (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX e vWA) em amostra populacional do Estado de São Paulo e em genomas sequenciados no âmbito dos projetos 1000 Genomes e HGDP, utilizando três programas: HipSTR, STRait Razor e toaSTR. Observou-se elevada consistência e acurácia quando comparados os resultados obtidos pela utilização destas três ferramentas. Entretanto, o uso de mais de um software contribui para aumentar a acurácia na inferência de genótipos, principalmente nos marcadores (D21S11, Penta D, Penta E) em que se observou maiores taxas de erros. Com os genótipos obtidos, foi avaliada a diversidade genética entre populações de diferentes regiões biogeográficas e foi estimada a ancestralidade populacional de populações miscigenadas. O conjunto de marcadores STR aqui utilizados mostrou ser efetivos para estimar a estrutura populacional e a ancestralidade em níveis populacional e individual. Apesar da menor diversidade interpopulacional característica destes marcadores, os resultados obtidos se mostraram perfeitamente alinhados ao conhecimento pré-existente relacionado à história demográfica das populações estudadas.
id USP_5035b27f435e2ae6c93fda87fc69e07a
oai_identifier_str oai:teses.usp.br:tde-05062023-114855
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completosGenetic diversity of global populations inferred by autosomal STRs used for human identification genotyped from complete genomesBioinformáticaBioinformaticsForensic geneticsGenética forenseMassively parallel sequencingMicrosatellitesMicrossatélitesRepetições curtas em tandemSequenciamento massivo em paraleloShort tandem repeatsOs marcadores STRs compreendem cerca de 3% do genoma humano. Uma estratégia para compreender melhor a constituição genética de uma população é estimar a distribuição das frequências alélicas de marcadores STRs. A técnica de PCR junto com a eletroforese capilar são, até hoje, as técnicas de escolha para a genotipagem de marcadores STR. As tecnologias de NGS revolucionaram as ciências biológicas, permitindo o sequenciamento simultâneo de muitas amostras de DNA ou RNA em um curto período de tempo. Com os avanços tecnológicos e a utilização cada vez mais frequente das técnicas de NGS surge a necessidade de testar a efetividade dessa técnica na genotipagem de marcadores STRs. Algumas ferramentas foram desenvolvidas para analisar estes marcadores a partir de dados de NGS, tais como STRait Razor, toaSTR, e HipSTR, entre outras. Existem vários projetos colaborativos internacionais como o Projeto Genoma Humano, o projeto 1000 genomas, o Human Genome Diversity Project (HGDP) entre outros, que disponibilizaram os dados de sequência dos indivíduos analisados, permitindo que estes genomas possam ser estudados com diferentes abordagens voltadas para o estudo da variação genética entre populações diferentes ao redor do mundo. Esse trabalho tem como hipótese que conjuntos de marcadores STRs utilizados para identificação humana e genotipados a partir de genomas completos seriam adequados para estudos de diversidade genética e estimativas de ancestralidade populacional e individual. O objetivo geral foi avaliar os níveis de diversidade e a estrutura genética de populações humanas de diferentes regiões biogeográficas por meio de conjuntos de marcadores STR genotipados com tecnologia de sequenciamento de nova geração. Foram estudados 22 marcadores autossômicos (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX e vWA) em amostra populacional do Estado de São Paulo e em genomas sequenciados no âmbito dos projetos 1000 Genomes e HGDP, utilizando três programas: HipSTR, STRait Razor e toaSTR. Observou-se elevada consistência e acurácia quando comparados os resultados obtidos pela utilização destas três ferramentas. Entretanto, o uso de mais de um software contribui para aumentar a acurácia na inferência de genótipos, principalmente nos marcadores (D21S11, Penta D, Penta E) em que se observou maiores taxas de erros. Com os genótipos obtidos, foi avaliada a diversidade genética entre populações de diferentes regiões biogeográficas e foi estimada a ancestralidade populacional de populações miscigenadas. O conjunto de marcadores STR aqui utilizados mostrou ser efetivos para estimar a estrutura populacional e a ancestralidade em níveis populacional e individual. Apesar da menor diversidade interpopulacional característica destes marcadores, os resultados obtidos se mostraram perfeitamente alinhados ao conhecimento pré-existente relacionado à história demográfica das populações estudadas.STR markers comprise about 3% of the human genome. One strategy to better understand the genetic make-up of a population is to estimate the distribution of allele frequencies of STR markers. The PCR technique together with capillary electrophoresis are, until today, the techniques of choice for genotyping STR markers. NGS technologies have revolutionized the biological sciences, allowing the simultaneous sequencing of many DNA or RNA samples in a short period of time. With technological advances and the increasingly frequent use of NGS techniques, there is a need to test the effectiveness of this technique in genotyping STR markers. Some tools have been developed to analyze these markers from NGS data, such as STRait Razor, toaSTR, and HipSTR, among others. There are several international collaborative projects such as the Human Genome Project, the 1000 Genomes Project, the Human Genome Diversity Project (HGDP) among others, which made available the sequence data of the analyzed individuals, allowing these genomes to be studied with different approaches aimed at studying the genetic variation among different populations around the world. The hypothesis of the present study is that sets of STR markers used for human identification and genotyped from complete genomes would be suitable for studies of genetic diversity and estimates of population and individual ancestry. The general objective was to evaluate the levels of diversity and the genetic structure of human populations from different biogeographical regions through sets of STR markers genotyped with next-generation sequencing technology. Twenty-two STR markers (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX, and vWA) were studied in a population sample from the State of São Paulo and in genomes sequenced within the scope of the 1000 Genomes and HGDP projects, using three programs: HipSTR, STRait Razor and toaSTR. High consistency and accuracy were observed when comparing the results obtained by using these three tools. However, the use of more than one software contributes to increase the accuracy in the inference of genotypes, mainly in the markers (D21S11, Penta D, Penta E) in which higher error rates were observed. With the genotypes obtained, the genetic diversity between populations from different biogeographical regions was evaluated and the population ancestry of mixed populations was estimated. The set of STR markers used here proved to be effective for estimating population structure and ancestry at population and individual levels. Despite the lower interpopulational diversity characteristic of these markers, the results obtained were perfectly aligned with the pre-existing knowledge related to the demographic history of the studied populations.Biblioteca Digitais de Teses e Dissertações da USPMendes Junior, Celso TeixeiraRecalde, Tamara Soledad Frontanilla2023-03-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-06-12T14:47:34Zoai:teses.usp.br:tde-05062023-114855Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-06-12T14:47:34Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
Genetic diversity of global populations inferred by autosomal STRs used for human identification genotyped from complete genomes
title Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
spellingShingle Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
Recalde, Tamara Soledad Frontanilla
Bioinformática
Bioinformatics
Forensic genetics
Genética forense
Massively parallel sequencing
Microsatellites
Microssatélites
Repetições curtas em tandem
Sequenciamento massivo em paralelo
Short tandem repeats
title_short Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
title_full Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
title_fullStr Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
title_full_unstemmed Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
title_sort Diversidade genética de populações globais inferida por STRs autossômicos utilizados para identificação humana genotipados a partir de genomas completos
author Recalde, Tamara Soledad Frontanilla
author_facet Recalde, Tamara Soledad Frontanilla
author_role author
dc.contributor.none.fl_str_mv Mendes Junior, Celso Teixeira
dc.contributor.author.fl_str_mv Recalde, Tamara Soledad Frontanilla
dc.subject.por.fl_str_mv Bioinformática
Bioinformatics
Forensic genetics
Genética forense
Massively parallel sequencing
Microsatellites
Microssatélites
Repetições curtas em tandem
Sequenciamento massivo em paralelo
Short tandem repeats
topic Bioinformática
Bioinformatics
Forensic genetics
Genética forense
Massively parallel sequencing
Microsatellites
Microssatélites
Repetições curtas em tandem
Sequenciamento massivo em paralelo
Short tandem repeats
description Os marcadores STRs compreendem cerca de 3% do genoma humano. Uma estratégia para compreender melhor a constituição genética de uma população é estimar a distribuição das frequências alélicas de marcadores STRs. A técnica de PCR junto com a eletroforese capilar são, até hoje, as técnicas de escolha para a genotipagem de marcadores STR. As tecnologias de NGS revolucionaram as ciências biológicas, permitindo o sequenciamento simultâneo de muitas amostras de DNA ou RNA em um curto período de tempo. Com os avanços tecnológicos e a utilização cada vez mais frequente das técnicas de NGS surge a necessidade de testar a efetividade dessa técnica na genotipagem de marcadores STRs. Algumas ferramentas foram desenvolvidas para analisar estes marcadores a partir de dados de NGS, tais como STRait Razor, toaSTR, e HipSTR, entre outras. Existem vários projetos colaborativos internacionais como o Projeto Genoma Humano, o projeto 1000 genomas, o Human Genome Diversity Project (HGDP) entre outros, que disponibilizaram os dados de sequência dos indivíduos analisados, permitindo que estes genomas possam ser estudados com diferentes abordagens voltadas para o estudo da variação genética entre populações diferentes ao redor do mundo. Esse trabalho tem como hipótese que conjuntos de marcadores STRs utilizados para identificação humana e genotipados a partir de genomas completos seriam adequados para estudos de diversidade genética e estimativas de ancestralidade populacional e individual. O objetivo geral foi avaliar os níveis de diversidade e a estrutura genética de populações humanas de diferentes regiões biogeográficas por meio de conjuntos de marcadores STR genotipados com tecnologia de sequenciamento de nova geração. Foram estudados 22 marcadores autossômicos (CSF1PO, D1S1656, D2S441, D2S1338, D3S1358, D5S818, D7S820, D8S1179, D10S1248, D12S391, D13S317, D16S539, D18S51, D19S433, D21S11, D22S1045, FGA, Penta D, Penta E, TH01, TPOX e vWA) em amostra populacional do Estado de São Paulo e em genomas sequenciados no âmbito dos projetos 1000 Genomes e HGDP, utilizando três programas: HipSTR, STRait Razor e toaSTR. Observou-se elevada consistência e acurácia quando comparados os resultados obtidos pela utilização destas três ferramentas. Entretanto, o uso de mais de um software contribui para aumentar a acurácia na inferência de genótipos, principalmente nos marcadores (D21S11, Penta D, Penta E) em que se observou maiores taxas de erros. Com os genótipos obtidos, foi avaliada a diversidade genética entre populações de diferentes regiões biogeográficas e foi estimada a ancestralidade populacional de populações miscigenadas. O conjunto de marcadores STR aqui utilizados mostrou ser efetivos para estimar a estrutura populacional e a ancestralidade em níveis populacional e individual. Apesar da menor diversidade interpopulacional característica destes marcadores, os resultados obtidos se mostraram perfeitamente alinhados ao conhecimento pré-existente relacionado à história demográfica das populações estudadas.
publishDate 2023
dc.date.none.fl_str_mv 2023-03-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/
url https://www.teses.usp.br/teses/disponiveis/17/17135/tde-05062023-114855/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815256696198529024