Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/104/104131/tde-10032022-163610/ |
Resumo: | Neste trabalho, métodos Bayesianos para estimação e seleção de variáveis em um modelo de mistura de regressão logística são apresentados. Com o objetivo de simplificar a inferência Bayesiana e ganhar eficiência computacional, a abordagem de aumento de dados com variáveis latentes Pólya-Gama é estendida para modelos de mistura de regressão logística. Através dela, o algoritmo amostrador de Gibbs é aplicado para a estimação do modelo completo, com a estimação do número de componentes da mistura sendo feita através de critérios Bayesianos de seleção de modelos. Para a seleção de variáveis, duas distribuições a priori para os coeficientes de regressão são investigadas, adicionando um segundo conjunto de variáveis latentes para indicar a presença e ausência das variáveis preditoras em cada componente da mistura. De modo análogo ao modelo completo, o algoritmo amostrador de Gibbs é aplicado no modelo com a seleção de variáveis e a conjugação obtida para a distribuição dos coeficientes de regressão, com a inclusão das variáveis Pólya-Gama, nos permite calcular analiticamente a verossimilhança marginal e ganhar eficiência computacional no processo de seleção de variáveis. Para analisar a performance dos métodos, as metodologias apresentadas são aplicadas em dados simulados e reais. |
id |
USP_7096570ed631a82024a722adda83088c |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-10032022-163610 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-GammaBayesian variable selection for logistic mixture models with Pólya-Gamma data augmentationG-priorG-prioriPólya-Gamma-samplingPólya-Gamma-samplingPriori spike e slabSeleção de variáveisSpike and slab priorVariable selectionNeste trabalho, métodos Bayesianos para estimação e seleção de variáveis em um modelo de mistura de regressão logística são apresentados. Com o objetivo de simplificar a inferência Bayesiana e ganhar eficiência computacional, a abordagem de aumento de dados com variáveis latentes Pólya-Gama é estendida para modelos de mistura de regressão logística. Através dela, o algoritmo amostrador de Gibbs é aplicado para a estimação do modelo completo, com a estimação do número de componentes da mistura sendo feita através de critérios Bayesianos de seleção de modelos. Para a seleção de variáveis, duas distribuições a priori para os coeficientes de regressão são investigadas, adicionando um segundo conjunto de variáveis latentes para indicar a presença e ausência das variáveis preditoras em cada componente da mistura. De modo análogo ao modelo completo, o algoritmo amostrador de Gibbs é aplicado no modelo com a seleção de variáveis e a conjugação obtida para a distribuição dos coeficientes de regressão, com a inclusão das variáveis Pólya-Gama, nos permite calcular analiticamente a verossimilhança marginal e ganhar eficiência computacional no processo de seleção de variáveis. Para analisar a performance dos métodos, as metodologias apresentadas são aplicadas em dados simulados e reais.In this work, Bayesian methods for estimating and selecting variables in a mixture of logistic regressions model are presented. In order to simplify its Bayesian estimation, we extend the data augmentation approach with Pólya-Gamma random variables to the mixture of logistic regression models. Through the data augmentation approach, we present a Gibbs sampling algorithm for estimating the full model, and the number of components in the mixture is identified by Bayesian model selection criteria. In the model with variable selection, we investigate the performance of two prior distributions for the regression coefficients, adding a second set of latent variables to indicate the presence and non-presence of the predictor variables at each component of the mixture. Analogously to the full model, a Gibbs sampling algorithm is applied to the model with variable selection and the conjugation obtained for the distribution of the regression coefficients, through the inclusion of Pólya-Gamma variables, allows us to analytically calculate the marginal likelihood and gain computational efficiency in the variable selection process. To analyse the performance, the presented methodologies are applied in simulated and real data.Biblioteca Digitais de Teses e Dissertações da USPZuanetti, Daiane AparecidaBogoni, Mariella Ananias2022-02-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/104/104131/tde-10032022-163610/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-03-10T19:44:02Zoai:teses.usp.br:tde-10032022-163610Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-03-10T19:44:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma Bayesian variable selection for logistic mixture models with Pólya-Gamma data augmentation |
title |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma |
spellingShingle |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma Bogoni, Mariella Ananias G-prior G-priori Pólya-Gamma-sampling Pólya-Gamma-sampling Priori spike e slab Seleção de variáveis Spike and slab prior Variable selection |
title_short |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma |
title_full |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma |
title_fullStr |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma |
title_full_unstemmed |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma |
title_sort |
Seleção Bayesiana de variáveis para modelos de mistura de regressão logística com variáveis latentes Pólya-Gamma |
author |
Bogoni, Mariella Ananias |
author_facet |
Bogoni, Mariella Ananias |
author_role |
author |
dc.contributor.none.fl_str_mv |
Zuanetti, Daiane Aparecida |
dc.contributor.author.fl_str_mv |
Bogoni, Mariella Ananias |
dc.subject.por.fl_str_mv |
G-prior G-priori Pólya-Gamma-sampling Pólya-Gamma-sampling Priori spike e slab Seleção de variáveis Spike and slab prior Variable selection |
topic |
G-prior G-priori Pólya-Gamma-sampling Pólya-Gamma-sampling Priori spike e slab Seleção de variáveis Spike and slab prior Variable selection |
description |
Neste trabalho, métodos Bayesianos para estimação e seleção de variáveis em um modelo de mistura de regressão logística são apresentados. Com o objetivo de simplificar a inferência Bayesiana e ganhar eficiência computacional, a abordagem de aumento de dados com variáveis latentes Pólya-Gama é estendida para modelos de mistura de regressão logística. Através dela, o algoritmo amostrador de Gibbs é aplicado para a estimação do modelo completo, com a estimação do número de componentes da mistura sendo feita através de critérios Bayesianos de seleção de modelos. Para a seleção de variáveis, duas distribuições a priori para os coeficientes de regressão são investigadas, adicionando um segundo conjunto de variáveis latentes para indicar a presença e ausência das variáveis preditoras em cada componente da mistura. De modo análogo ao modelo completo, o algoritmo amostrador de Gibbs é aplicado no modelo com a seleção de variáveis e a conjugação obtida para a distribuição dos coeficientes de regressão, com a inclusão das variáveis Pólya-Gama, nos permite calcular analiticamente a verossimilhança marginal e ganhar eficiência computacional no processo de seleção de variáveis. Para analisar a performance dos métodos, as metodologias apresentadas são aplicadas em dados simulados e reais. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-02-15 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-10032022-163610/ |
url |
https://www.teses.usp.br/teses/disponiveis/104/104131/tde-10032022-163610/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256906032218112 |