Beta regression with a small cluster at a boundary
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/ |
Resumo: | Analyses of data that have response variables contained in the (0,1) interval have received a lot of attention in the past two decades, most notably through the use of the beta regression model. However, there are situtations where there are boundary observations in the data, i.e. observations equal to zero or to one, in which other methodologies must be considered. In this work, the focus is on data that have a small custer of observations at one of the boundaries and the methods used either provide ways to still fit a beta regression model, via maximum likelihood or via a robust estimation method, for these scenarios by adapting the data to fit onto the (0,1) interval or using a model that can naturally cope with the presence boundary observations; here, the inflated beta regression model and a quasi-likelihood model were used for this purpose. The methods were applied to two different datasets that had distinct characteristics; diagnostic analyses were conducted to assess the quality of the fits and then simulation scenarios were carried out to evaluate the performance of each of the methods in situations that may arise in practice. Finally, some conclusions were made about which methods work best in each of the situations explored. |
id |
USP_b5a5e3185c0ad95f4c0e5c117f930a32 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-29072021-150954 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Beta regression with a small cluster at a boundaryRegressão beta com um pequeno cluster em uma fronteiraBeta regressionBoundary observationsEstimação robustaInflated beta regressionObservações de fronteiraQuasi-likelihoodQuasi-verossimilhançaRegressão betaRegressão beta inflacionadaRobust estimationAnalyses of data that have response variables contained in the (0,1) interval have received a lot of attention in the past two decades, most notably through the use of the beta regression model. However, there are situtations where there are boundary observations in the data, i.e. observations equal to zero or to one, in which other methodologies must be considered. In this work, the focus is on data that have a small custer of observations at one of the boundaries and the methods used either provide ways to still fit a beta regression model, via maximum likelihood or via a robust estimation method, for these scenarios by adapting the data to fit onto the (0,1) interval or using a model that can naturally cope with the presence boundary observations; here, the inflated beta regression model and a quasi-likelihood model were used for this purpose. The methods were applied to two different datasets that had distinct characteristics; diagnostic analyses were conducted to assess the quality of the fits and then simulation scenarios were carried out to evaluate the performance of each of the methods in situations that may arise in practice. Finally, some conclusions were made about which methods work best in each of the situations explored.Análises de dados cujas variáveis respostas estão contidas no intervalo (0,1) têm recebido muita atenção nas últimas duas décadas, principalmente com o uso do modelo de regressão beta. No entanto, existem situações em que os dados contêm observações nas fronteiras, isto, é observações iguais a zero ou a um, em que outras metodolgias precisam ser consideradas, Neste trabalho, o foco é em dados que têm um pequeno cluster de observações em uma das fronteiras e os métodos utilizados fornecem maneiras de continuar ajustando um modelo de regressão beta, por máxima verossimilhança ou por um método de estimação robusto, para estes cenários após uma adaptação dos dados ou usar um modelo que é capaz lidar com a presença de observações nas fronteiras; aqui, o modelo de regressão beta inflacionado e um modelo de quasi-verossimilhança foram usados para esta finalidade. Os métodos foram aplicados em dois conjuntos de dados com características distintas; análises de diagnóstico foram conduzidas para avaliar a qualidade dos ajustes e então, cenários de simulação foram feitos para avaliar a performance de cada um dos métodos em situações que podem surgir na prática. Finalmente, algumas conclusões foram apresentadas sobre quais métodos funcionam melhor em cada uma das situações exploradas.Biblioteca Digitais de Teses e Dissertações da USPFerrari, Silvia Lopes de PaulaNóbrega, Daniel Araújo2021-06-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-08-19T11:43:02Zoai:teses.usp.br:tde-29072021-150954Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-19T11:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Beta regression with a small cluster at a boundary Regressão beta com um pequeno cluster em uma fronteira |
title |
Beta regression with a small cluster at a boundary |
spellingShingle |
Beta regression with a small cluster at a boundary Nóbrega, Daniel Araújo Beta regression Boundary observations Estimação robusta Inflated beta regression Observações de fronteira Quasi-likelihood Quasi-verossimilhança Regressão beta Regressão beta inflacionada Robust estimation |
title_short |
Beta regression with a small cluster at a boundary |
title_full |
Beta regression with a small cluster at a boundary |
title_fullStr |
Beta regression with a small cluster at a boundary |
title_full_unstemmed |
Beta regression with a small cluster at a boundary |
title_sort |
Beta regression with a small cluster at a boundary |
author |
Nóbrega, Daniel Araújo |
author_facet |
Nóbrega, Daniel Araújo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ferrari, Silvia Lopes de Paula |
dc.contributor.author.fl_str_mv |
Nóbrega, Daniel Araújo |
dc.subject.por.fl_str_mv |
Beta regression Boundary observations Estimação robusta Inflated beta regression Observações de fronteira Quasi-likelihood Quasi-verossimilhança Regressão beta Regressão beta inflacionada Robust estimation |
topic |
Beta regression Boundary observations Estimação robusta Inflated beta regression Observações de fronteira Quasi-likelihood Quasi-verossimilhança Regressão beta Regressão beta inflacionada Robust estimation |
description |
Analyses of data that have response variables contained in the (0,1) interval have received a lot of attention in the past two decades, most notably through the use of the beta regression model. However, there are situtations where there are boundary observations in the data, i.e. observations equal to zero or to one, in which other methodologies must be considered. In this work, the focus is on data that have a small custer of observations at one of the boundaries and the methods used either provide ways to still fit a beta regression model, via maximum likelihood or via a robust estimation method, for these scenarios by adapting the data to fit onto the (0,1) interval or using a model that can naturally cope with the presence boundary observations; here, the inflated beta regression model and a quasi-likelihood model were used for this purpose. The methods were applied to two different datasets that had distinct characteristics; diagnostic analyses were conducted to assess the quality of the fits and then simulation scenarios were carried out to evaluate the performance of each of the methods in situations that may arise in practice. Finally, some conclusions were made about which methods work best in each of the situations explored. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-06-30 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/ |
url |
https://www.teses.usp.br/teses/disponiveis/45/45133/tde-29072021-150954/ |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815257480707440640 |