Beta regression with a small cluster at a boundary

Detalhes bibliográficos
Autor(a) principal: Nóbrega, Daniel Araújo
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/
Resumo: Analyses of data that have response variables contained in the (0,1) interval have received a lot of attention in the past two decades, most notably through the use of the beta regression model. However, there are situtations where there are boundary observations in the data, i.e. observations equal to zero or to one, in which other methodologies must be considered. In this work, the focus is on data that have a small custer of observations at one of the boundaries and the methods used either provide ways to still fit a beta regression model, via maximum likelihood or via a robust estimation method, for these scenarios by adapting the data to fit onto the (0,1) interval or using a model that can naturally cope with the presence boundary observations; here, the inflated beta regression model and a quasi-likelihood model were used for this purpose. The methods were applied to two different datasets that had distinct characteristics; diagnostic analyses were conducted to assess the quality of the fits and then simulation scenarios were carried out to evaluate the performance of each of the methods in situations that may arise in practice. Finally, some conclusions were made about which methods work best in each of the situations explored.
id USP_b5a5e3185c0ad95f4c0e5c117f930a32
oai_identifier_str oai:teses.usp.br:tde-29072021-150954
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Beta regression with a small cluster at a boundaryRegressão beta com um pequeno cluster em uma fronteiraBeta regressionBoundary observationsEstimação robustaInflated beta regressionObservações de fronteiraQuasi-likelihoodQuasi-verossimilhançaRegressão betaRegressão beta inflacionadaRobust estimationAnalyses of data that have response variables contained in the (0,1) interval have received a lot of attention in the past two decades, most notably through the use of the beta regression model. However, there are situtations where there are boundary observations in the data, i.e. observations equal to zero or to one, in which other methodologies must be considered. In this work, the focus is on data that have a small custer of observations at one of the boundaries and the methods used either provide ways to still fit a beta regression model, via maximum likelihood or via a robust estimation method, for these scenarios by adapting the data to fit onto the (0,1) interval or using a model that can naturally cope with the presence boundary observations; here, the inflated beta regression model and a quasi-likelihood model were used for this purpose. The methods were applied to two different datasets that had distinct characteristics; diagnostic analyses were conducted to assess the quality of the fits and then simulation scenarios were carried out to evaluate the performance of each of the methods in situations that may arise in practice. Finally, some conclusions were made about which methods work best in each of the situations explored.Análises de dados cujas variáveis respostas estão contidas no intervalo (0,1) têm recebido muita atenção nas últimas duas décadas, principalmente com o uso do modelo de regressão beta. No entanto, existem situações em que os dados contêm observações nas fronteiras, isto, é observações iguais a zero ou a um, em que outras metodolgias precisam ser consideradas, Neste trabalho, o foco é em dados que têm um pequeno cluster de observações em uma das fronteiras e os métodos utilizados fornecem maneiras de continuar ajustando um modelo de regressão beta, por máxima verossimilhança ou por um método de estimação robusto, para estes cenários após uma adaptação dos dados ou usar um modelo que é capaz lidar com a presença de observações nas fronteiras; aqui, o modelo de regressão beta inflacionado e um modelo de quasi-verossimilhança foram usados para esta finalidade. Os métodos foram aplicados em dois conjuntos de dados com características distintas; análises de diagnóstico foram conduzidas para avaliar a qualidade dos ajustes e então, cenários de simulação foram feitos para avaliar a performance de cada um dos métodos em situações que podem surgir na prática. Finalmente, algumas conclusões foram apresentadas sobre quais métodos funcionam melhor em cada uma das situações exploradas.Biblioteca Digitais de Teses e Dissertações da USPFerrari, Silvia Lopes de PaulaNóbrega, Daniel Araújo2021-06-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-08-19T11:43:02Zoai:teses.usp.br:tde-29072021-150954Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-19T11:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Beta regression with a small cluster at a boundary
Regressão beta com um pequeno cluster em uma fronteira
title Beta regression with a small cluster at a boundary
spellingShingle Beta regression with a small cluster at a boundary
Nóbrega, Daniel Araújo
Beta regression
Boundary observations
Estimação robusta
Inflated beta regression
Observações de fronteira
Quasi-likelihood
Quasi-verossimilhança
Regressão beta
Regressão beta inflacionada
Robust estimation
title_short Beta regression with a small cluster at a boundary
title_full Beta regression with a small cluster at a boundary
title_fullStr Beta regression with a small cluster at a boundary
title_full_unstemmed Beta regression with a small cluster at a boundary
title_sort Beta regression with a small cluster at a boundary
author Nóbrega, Daniel Araújo
author_facet Nóbrega, Daniel Araújo
author_role author
dc.contributor.none.fl_str_mv Ferrari, Silvia Lopes de Paula
dc.contributor.author.fl_str_mv Nóbrega, Daniel Araújo
dc.subject.por.fl_str_mv Beta regression
Boundary observations
Estimação robusta
Inflated beta regression
Observações de fronteira
Quasi-likelihood
Quasi-verossimilhança
Regressão beta
Regressão beta inflacionada
Robust estimation
topic Beta regression
Boundary observations
Estimação robusta
Inflated beta regression
Observações de fronteira
Quasi-likelihood
Quasi-verossimilhança
Regressão beta
Regressão beta inflacionada
Robust estimation
description Analyses of data that have response variables contained in the (0,1) interval have received a lot of attention in the past two decades, most notably through the use of the beta regression model. However, there are situtations where there are boundary observations in the data, i.e. observations equal to zero or to one, in which other methodologies must be considered. In this work, the focus is on data that have a small custer of observations at one of the boundaries and the methods used either provide ways to still fit a beta regression model, via maximum likelihood or via a robust estimation method, for these scenarios by adapting the data to fit onto the (0,1) interval or using a model that can naturally cope with the presence boundary observations; here, the inflated beta regression model and a quasi-likelihood model were used for this purpose. The methods were applied to two different datasets that had distinct characteristics; diagnostic analyses were conducted to assess the quality of the fits and then simulation scenarios were carried out to evaluate the performance of each of the methods in situations that may arise in practice. Finally, some conclusions were made about which methods work best in each of the situations explored.
publishDate 2021
dc.date.none.fl_str_mv 2021-06-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/
url https://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257480707440640