Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais

Detalhes bibliográficos
Autor(a) principal: Luciana Aparecida Carlini-Garcia
Data de Publicação: 2001
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/T.11.2020.tde-20200111-131551
Resumo: Muitos autores têm utilizado marcadores isoenzimáticos ou moleculares para estudar a estrutura genética e o sistema reprodutivo de populações naturais. Para tanto, parâmetros populacionais de interesse são estimados, mas há pouca informação sobre o erro associado a essas estimativas em função dos diferentes níveis de amostragem. Através dessa informação, estratégias de amostragem poderiam ser estabelecidas de modo a reduzir a magnitude dos erros associados a tais estimativas. No presente trabalho foram utilizados conjuntos de dados reais, além de dados simulados em algumas situações. Para os dados reais, foram feitas reamostragens bootstrap de locos, indivíduos, populações, e indivíduos e populações concomitantemente. Para os parâmetros índice de fixação total (F), diversidade entre populações ou grau de coancestralidade nas populações (θ), índice de fixação dentro das populações (ƒ), taxa aparente de cruzamento (ta), fluxo de genes entre populações (Nm) e tamanho efetivo populacional (Ne) foi possível obter, em função das diferentes fontes de reamostragem, os erros associados às estimativas desses parâmetros, a distribuição empírica dessas estimativas e intervalos de confiança para tais parâmetros. Em geral, as menores variâncias estão associadas às estimativas de θ. O contrário foi observado para F, ƒ e Nm. Verificou-se que apenas as distribuições empíricas de F̂ e f̂; tendem à normalidade. Isso ocorreu somente quando foram feitas reamostragens envolvendo indivíduos, possivelmente por serem mais numerosos que populações e locos. A partir dos dados reais e simulados, para os parâmetros F, ƒ e θ individualmente e em conjunto, verificou-se que as estimativas das variâncias devidas à reamostragem de indivíduos e de populações isoladamente são aditivas. Consequentemente, pode-se calcular a contribuição relativa destas duas fontes de variação para a variância total das estimativas. Foi possível concluir que dois métodos de verificação da importância relativa das causas de variação de populações e de indivíduos, como fonte de erros das estimativas dos parâmetros F, ƒ e θ, em geral, apresentaram resultados concordantes. Para obter o número necessário de locos, indivíduos e populações, visando atingir uma determinada precisão na estimação de F, ƒ e θ, foram feitas reamostragens com tamanho variável de amostras bootstrap. Para os diversos níveis dos fatores locos, indivíduos e populações, foram estimadas as respectivas variâncias e construídas curvas de regressão entre o número de populações, ou indivíduos ou locos e os erros de estimação associados. Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ, considerando a magnitude estabelecida para os erros das estimativas. Observou-se também que a fonte de variação de locos foi responsável pelos maiores erros das estimativas dos parâmetros F e ƒ. Portanto, em pesquisas futuras dessa natureza, é recomendável atentar para a necessidade de trabalhar com número adequado de locos. Este número certamente deve ser maior do que o comumente utilizado. A fonte de variação de populações também foi importante na estimação dos parâmetros F e θ, devendo assim merecer a devida atenção. Diante dessas informações, evidencia-se a importância da aplicação de bootstrap na mensuração da precisão de estimativas de parâmetros populacionais, em função das diversas fontes de variação
id USP_abce9ad167c05031ea94fd66f6e9f83a
oai_identifier_str oai:teses.usp.br:tde-20200111-131551
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais Use of Bootstrap in the estimation of population genetic parameters 2001-03-29Ana Maria Meira de LelloLuciana Aparecida Carlini-GarciaUniversidade de São PauloAgronomia (Genética e Melhoramento de Plantas)USPBR GENÉTICA DE POPULAÇÕES PARÂMETROS REAMOSTRAGEM BOOTSTRAP Muitos autores têm utilizado marcadores isoenzimáticos ou moleculares para estudar a estrutura genética e o sistema reprodutivo de populações naturais. Para tanto, parâmetros populacionais de interesse são estimados, mas há pouca informação sobre o erro associado a essas estimativas em função dos diferentes níveis de amostragem. Através dessa informação, estratégias de amostragem poderiam ser estabelecidas de modo a reduzir a magnitude dos erros associados a tais estimativas. No presente trabalho foram utilizados conjuntos de dados reais, além de dados simulados em algumas situações. Para os dados reais, foram feitas reamostragens bootstrap de locos, indivíduos, populações, e indivíduos e populações concomitantemente. Para os parâmetros índice de fixação total (F), diversidade entre populações ou grau de coancestralidade nas populações (θ), índice de fixação dentro das populações (ƒ), taxa aparente de cruzamento (ta), fluxo de genes entre populações (Nm) e tamanho efetivo populacional (Ne) foi possível obter, em função das diferentes fontes de reamostragem, os erros associados às estimativas desses parâmetros, a distribuição empírica dessas estimativas e intervalos de confiança para tais parâmetros. Em geral, as menores variâncias estão associadas às estimativas de θ. O contrário foi observado para F, ƒ e Nm. Verificou-se que apenas as distribuições empíricas de F̂ e f̂; tendem à normalidade. Isso ocorreu somente quando foram feitas reamostragens envolvendo indivíduos, possivelmente por serem mais numerosos que populações e locos. A partir dos dados reais e simulados, para os parâmetros F, ƒ e θ individualmente e em conjunto, verificou-se que as estimativas das variâncias devidas à reamostragem de indivíduos e de populações isoladamente são aditivas. Consequentemente, pode-se calcular a contribuição relativa destas duas fontes de variação para a variância total das estimativas. Foi possível concluir que dois métodos de verificação da importância relativa das causas de variação de populações e de indivíduos, como fonte de erros das estimativas dos parâmetros F, ƒ e θ, em geral, apresentaram resultados concordantes. Para obter o número necessário de locos, indivíduos e populações, visando atingir uma determinada precisão na estimação de F, ƒ e θ, foram feitas reamostragens com tamanho variável de amostras bootstrap. Para os diversos níveis dos fatores locos, indivíduos e populações, foram estimadas as respectivas variâncias e construídas curvas de regressão entre o número de populações, ou indivíduos ou locos e os erros de estimação associados. Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ, considerando a magnitude estabelecida para os erros das estimativas. Observou-se também que a fonte de variação de locos foi responsável pelos maiores erros das estimativas dos parâmetros F e ƒ. Portanto, em pesquisas futuras dessa natureza, é recomendável atentar para a necessidade de trabalhar com número adequado de locos. Este número certamente deve ser maior do que o comumente utilizado. A fonte de variação de populações também foi importante na estimação dos parâmetros F e θ, devendo assim merecer a devida atenção. Diante dessas informações, evidencia-se a importância da aplicação de bootstrap na mensuração da precisão de estimativas de parâmetros populacionais, em função das diversas fontes de variação Genetic structure and mating system of natural populations have often been studied using molecular markers and isozymes. Specific genetic parameters are therefore being estimated for this purpose. There is little information about errors associated with these estimates due to different possible sampling leveis. The knowledge of this information could be used to minimize the magnitude of the errors associated with such estimates. Real and simulated datasets were used in this study. With the real datasets, bootstrapping over loci, individuals, populations and both individuals and populations simultaneously, was performed. These different resampling strategies produced errors of the estimates, empiric probability distributions and confidence intervals for the following parameters: total fixation index (F ), diversity among populations or coancestry index (θ ), fixation index within populations (ƒ ), apparent outcrossing rates (ta), gene flow between populations (Nm), and effective population size (Ne ). Generally, smaller variances were associated with estimates of θ , whereas the largest were associated with F̂, ̂, and N̂m. The only estimates approaching normality were F, ƒ, when individuals were involved in the resampling process. This was probably caused by the larger number of individuals comparison with the number of loci and populations commonly used. Resampling both simulated and real datasets for estimation of , ƒ and θ jointly and separately showed that the variances due to individuals and due to populations are additive. Consequently, it is possible to calculate the relative contribution of these two sources of variation to the total variance of the estimates. There was overall agreement between results chained when two different methods were applied to assess the relative importance of individuals and populations as source of errors in the estimation of F , ƒ and θ. Bootstrap samples of variable sizes were used to determine the number of loci, individuals and populations necessary to achieve a given precision in the estimates of F, ƒ and θ. Variance estimates with different numbers of loci, individuals and population were obtained and regression analyses performed relating these estimates with the corresponding number of populations, individuals on loci. The magnitude of errors of the estimates in most real datasets indicated that sample sizes currently used in research involving natural populations would be suitable only for the estimation of θ. The largest errors of the estimates of F and ƒ were associated with sampling error due to loci. Therefore, future studies should use a larger number of loci to improve the estimation of these parameters. Sampling error due to populations was also important and should not be neglected for the estimation of F and ƒ. This study reinforced the importance of bootstrapping as a technique to measure precision of population parameter estimates under different sources of variation https://doi.org/10.11606/T.11.2020.tde-20200111-131551info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T19:38:44Zoai:teses.usp.br:tde-20200111-131551Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T13:01:26.544985Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
dc.title.alternative.en.fl_str_mv Use of Bootstrap in the estimation of population genetic parameters
title Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
spellingShingle Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
Luciana Aparecida Carlini-Garcia
title_short Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
title_full Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
title_fullStr Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
title_full_unstemmed Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
title_sort Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
author Luciana Aparecida Carlini-Garcia
author_facet Luciana Aparecida Carlini-Garcia
author_role author
dc.contributor.advisor1.fl_str_mv Ana Maria Meira de Lello
dc.contributor.author.fl_str_mv Luciana Aparecida Carlini-Garcia
contributor_str_mv Ana Maria Meira de Lello
description Muitos autores têm utilizado marcadores isoenzimáticos ou moleculares para estudar a estrutura genética e o sistema reprodutivo de populações naturais. Para tanto, parâmetros populacionais de interesse são estimados, mas há pouca informação sobre o erro associado a essas estimativas em função dos diferentes níveis de amostragem. Através dessa informação, estratégias de amostragem poderiam ser estabelecidas de modo a reduzir a magnitude dos erros associados a tais estimativas. No presente trabalho foram utilizados conjuntos de dados reais, além de dados simulados em algumas situações. Para os dados reais, foram feitas reamostragens bootstrap de locos, indivíduos, populações, e indivíduos e populações concomitantemente. Para os parâmetros índice de fixação total (F), diversidade entre populações ou grau de coancestralidade nas populações (θ), índice de fixação dentro das populações (ƒ), taxa aparente de cruzamento (ta), fluxo de genes entre populações (Nm) e tamanho efetivo populacional (Ne) foi possível obter, em função das diferentes fontes de reamostragem, os erros associados às estimativas desses parâmetros, a distribuição empírica dessas estimativas e intervalos de confiança para tais parâmetros. Em geral, as menores variâncias estão associadas às estimativas de θ. O contrário foi observado para F, ƒ e Nm. Verificou-se que apenas as distribuições empíricas de F̂ e f̂; tendem à normalidade. Isso ocorreu somente quando foram feitas reamostragens envolvendo indivíduos, possivelmente por serem mais numerosos que populações e locos. A partir dos dados reais e simulados, para os parâmetros F, ƒ e θ individualmente e em conjunto, verificou-se que as estimativas das variâncias devidas à reamostragem de indivíduos e de populações isoladamente são aditivas. Consequentemente, pode-se calcular a contribuição relativa destas duas fontes de variação para a variância total das estimativas. Foi possível concluir que dois métodos de verificação da importância relativa das causas de variação de populações e de indivíduos, como fonte de erros das estimativas dos parâmetros F, ƒ e θ, em geral, apresentaram resultados concordantes. Para obter o número necessário de locos, indivíduos e populações, visando atingir uma determinada precisão na estimação de F, ƒ e θ, foram feitas reamostragens com tamanho variável de amostras bootstrap. Para os diversos níveis dos fatores locos, indivíduos e populações, foram estimadas as respectivas variâncias e construídas curvas de regressão entre o número de populações, ou indivíduos ou locos e os erros de estimação associados. Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ, considerando a magnitude estabelecida para os erros das estimativas. Observou-se também que a fonte de variação de locos foi responsável pelos maiores erros das estimativas dos parâmetros F e ƒ. Portanto, em pesquisas futuras dessa natureza, é recomendável atentar para a necessidade de trabalhar com número adequado de locos. Este número certamente deve ser maior do que o comumente utilizado. A fonte de variação de populações também foi importante na estimação dos parâmetros F e θ, devendo assim merecer a devida atenção. Diante dessas informações, evidencia-se a importância da aplicação de bootstrap na mensuração da precisão de estimativas de parâmetros populacionais, em função das diversas fontes de variação
publishDate 2001
dc.date.issued.fl_str_mv 2001-03-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/T.11.2020.tde-20200111-131551
url https://doi.org/10.11606/T.11.2020.tde-20200111-131551
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Agronomia (Genética e Melhoramento de Plantas)
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794502915500539904