Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta

Detalhes bibliográficos
Autor(a) principal: Queiroz, Francisco Felipe de
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-06092022-174833/
Resumo: Dados contínuos limitados, particularmente no intervalo unitário, aparecem em diferentes áreas, incluindo ecologia, biologia, economia e saúde pública. Alguns exemplos são a fração da cobertura vegetal, a proporção da renda familiar gasta em planos de saúde e a prevalência de doenças crônicas. Estes dados geralmente são altamente assimétricos, possuem dispersão dependendo da média e muitas vezes apresentam valores nas fronteiras. Modelos de regressão que utilizam a distribuição beta são amplamente empregados em aplicações. A regressão beta permite a interpretação direta dos parâmetros, acomoda assimetria e heterocedasticidade, sendo razoavelmente flexível. A inferência em modelos de regressão beta geralmente é baseada em métodos de máxima verossimilhança ou Bayesianos, para os quais a informação dos dados vem da função de verossimilhança. Em ambos os casos, a inferência pode ser altamente influenciada por observações atípicas. O procedimento de inferência pode então ser substituído por um método robusto ou pode-se empregar modelos baseados em distribuições mais flexíveis do que a distribuição beta. Nesta tese, contribuímos para a modelagem estatística de dados limitados em duas direções. Primeiramente, definimos e estudamos os modelos power logit, uma classe altamente flexível de modelos de regressão com parâmetros interpretáveis adequados para modelagem de dados limitados com diferentes características. São apresentadas medidas de diagnóstico e de influência, e um novo pacote computacional é desenvolvido. Apresentamos também os modelos de regressão power logit inflacionados, que podem ser empregados quando os dados incluem observações em um dos extremos do suporte. A segunda parte desta tese é dedicada ao desenvolvimento de métodos inferenciais robustos em regressão beta inflacionada. Os estimadores propostos possuem boas propriedades e apresentaram bom desempenho em experimentos de simulação. Rotinas computacionais para uso dos estimadores propostos são fornecidas.
id USP_c88d3ed120fc190a1e7603d28213404b
oai_identifier_str oai:teses.usp.br:tde-06092022-174833
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robustaBounded continuous data: power logit models and contributions to robust inferenceBeta regressionContinuous proportionDados fracionáriosFractional dataInferência robustaInflated beta regressionProporções contínuasRegressão betaRegressão beta inflacionadaRobust inferenceDados contínuos limitados, particularmente no intervalo unitário, aparecem em diferentes áreas, incluindo ecologia, biologia, economia e saúde pública. Alguns exemplos são a fração da cobertura vegetal, a proporção da renda familiar gasta em planos de saúde e a prevalência de doenças crônicas. Estes dados geralmente são altamente assimétricos, possuem dispersão dependendo da média e muitas vezes apresentam valores nas fronteiras. Modelos de regressão que utilizam a distribuição beta são amplamente empregados em aplicações. A regressão beta permite a interpretação direta dos parâmetros, acomoda assimetria e heterocedasticidade, sendo razoavelmente flexível. A inferência em modelos de regressão beta geralmente é baseada em métodos de máxima verossimilhança ou Bayesianos, para os quais a informação dos dados vem da função de verossimilhança. Em ambos os casos, a inferência pode ser altamente influenciada por observações atípicas. O procedimento de inferência pode então ser substituído por um método robusto ou pode-se empregar modelos baseados em distribuições mais flexíveis do que a distribuição beta. Nesta tese, contribuímos para a modelagem estatística de dados limitados em duas direções. Primeiramente, definimos e estudamos os modelos power logit, uma classe altamente flexível de modelos de regressão com parâmetros interpretáveis adequados para modelagem de dados limitados com diferentes características. São apresentadas medidas de diagnóstico e de influência, e um novo pacote computacional é desenvolvido. Apresentamos também os modelos de regressão power logit inflacionados, que podem ser empregados quando os dados incluem observações em um dos extremos do suporte. A segunda parte desta tese é dedicada ao desenvolvimento de métodos inferenciais robustos em regressão beta inflacionada. Os estimadores propostos possuem boas propriedades e apresentaram bom desempenho em experimentos de simulação. Rotinas computacionais para uso dos estimadores propostos são fornecidas.Bounded continuous data, particularly on the unit interval, appear in different areas, including ecology, biology, economics, and public health. Some examples are the fraction of vegetation cover, the proportion of family income spent on health plans, and the prevalence of chronic illness. The data are usually highly skewed, have dispersion depending on the mean, and often present values at the boundaries. Regression models that use the beta distribution are widely employed in applications. Beta regression allows direct parameter interpretation, asymmetry and heteroscedasticity while reasonably flexible. Inference in beta regression models is usually based on maximum likelihood or Bayesian methods, for which the information from the data comes from the likelihood function. In either case, the inference can be highly influenced by atypical observations. The inference procedure may then be replaced by a robust method, or one may employ models based on more flexible distributions than the beta distribution. In this dissertation, we contribute to the statistical modeling of bounded data in two directions. First, we define and study the power logit models, a highly flexible class of regression models with interpretable parameters suitable for modeling bounded data with different characteristics. Diagnostic and influence measures are presented, and a new computational package is developed. We also present the inflated power logit regression models, which may be employed when the data include observations at one of the extremes of the support set. The second part of this dissertation is devoted to developing robust inference methods in inflated beta regression. The proposed estimators have good properties and performed well in simulation experiments. Computational routines for using the proposed estimators are provided.Biblioteca Digitais de Teses e Dissertações da USPFerrari, Silvia Lopes de PaulaQueiroz, Francisco Felipe de2022-08-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45133/tde-06092022-174833/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-09-07T13:00:02Zoai:teses.usp.br:tde-06092022-174833Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-09-07T13:00:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
Bounded continuous data: power logit models and contributions to robust inference
title Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
spellingShingle Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
Queiroz, Francisco Felipe de
Beta regression
Continuous proportion
Dados fracionários
Fractional data
Inferência robusta
Inflated beta regression
Proporções contínuas
Regressão beta
Regressão beta inflacionada
Robust inference
title_short Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
title_full Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
title_fullStr Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
title_full_unstemmed Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
title_sort Análise de dados com suporte limitado: modelos power logit e contribuições à inferência robusta
author Queiroz, Francisco Felipe de
author_facet Queiroz, Francisco Felipe de
author_role author
dc.contributor.none.fl_str_mv Ferrari, Silvia Lopes de Paula
dc.contributor.author.fl_str_mv Queiroz, Francisco Felipe de
dc.subject.por.fl_str_mv Beta regression
Continuous proportion
Dados fracionários
Fractional data
Inferência robusta
Inflated beta regression
Proporções contínuas
Regressão beta
Regressão beta inflacionada
Robust inference
topic Beta regression
Continuous proportion
Dados fracionários
Fractional data
Inferência robusta
Inflated beta regression
Proporções contínuas
Regressão beta
Regressão beta inflacionada
Robust inference
description Dados contínuos limitados, particularmente no intervalo unitário, aparecem em diferentes áreas, incluindo ecologia, biologia, economia e saúde pública. Alguns exemplos são a fração da cobertura vegetal, a proporção da renda familiar gasta em planos de saúde e a prevalência de doenças crônicas. Estes dados geralmente são altamente assimétricos, possuem dispersão dependendo da média e muitas vezes apresentam valores nas fronteiras. Modelos de regressão que utilizam a distribuição beta são amplamente empregados em aplicações. A regressão beta permite a interpretação direta dos parâmetros, acomoda assimetria e heterocedasticidade, sendo razoavelmente flexível. A inferência em modelos de regressão beta geralmente é baseada em métodos de máxima verossimilhança ou Bayesianos, para os quais a informação dos dados vem da função de verossimilhança. Em ambos os casos, a inferência pode ser altamente influenciada por observações atípicas. O procedimento de inferência pode então ser substituído por um método robusto ou pode-se empregar modelos baseados em distribuições mais flexíveis do que a distribuição beta. Nesta tese, contribuímos para a modelagem estatística de dados limitados em duas direções. Primeiramente, definimos e estudamos os modelos power logit, uma classe altamente flexível de modelos de regressão com parâmetros interpretáveis adequados para modelagem de dados limitados com diferentes características. São apresentadas medidas de diagnóstico e de influência, e um novo pacote computacional é desenvolvido. Apresentamos também os modelos de regressão power logit inflacionados, que podem ser empregados quando os dados incluem observações em um dos extremos do suporte. A segunda parte desta tese é dedicada ao desenvolvimento de métodos inferenciais robustos em regressão beta inflacionada. Os estimadores propostos possuem boas propriedades e apresentaram bom desempenho em experimentos de simulação. Rotinas computacionais para uso dos estimadores propostos são fornecidas.
publishDate 2022
dc.date.none.fl_str_mv 2022-08-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45133/tde-06092022-174833/
url https://www.teses.usp.br/teses/disponiveis/45/45133/tde-06092022-174833/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279062666215424