Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade

Detalhes bibliográficos
Autor(a) principal: SILVA, Fernanda Clotilde da
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300000jh5m
Texto Completo: https://repositorio.ufpe.br/handle/123456789/44594
Resumo: Muitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0,1), nessas situações podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que se baseia em supor que a variável resposta segue uma distribuição beta, sob uma nova parametrização. Alguns métodos de análise de diagnóstico foram desenvol- vidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas. Entretanto, o uso desses métodos geralmente se- gue após a escolha de um conjunto de variáveis explicativas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e algumas medidas usadas como critérios de seleção têm sido desenvolvidas. Dentre elas destacam-se os pseudos R2, que visam avaliar a proporção de variação da resposta explicada pelo modelo ajustado, essas medidas foram estu- dadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos beta. Além dessas quantidades, também dispomos do critério de seleção P2, que busca avaliar a habilidade do modelo em predizer valores consistentes da variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) para o modelo normal linear, e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição des- ses critérios baseia-se no poder de explicação da variabilidade ou no poder de predição, esse trabalho tem como objetivo propor um processo de seleção para a classe de modelos beta con- siderando ambos os interesses, isto é, apresentar uma medida capaz de indicar modelos que consigam explicar bem a variabilidade da resposta, logo apresentam bons ajustes, e também consigam predizer bons valores. Esse processo consiste em determinar uma constante cha- mada “αˆ ”, obtido com base no método bootstrap paramétrico, usada para construir uma nova estatística chamada “BV” (Bias and Variability), que diz respeito ao balanceamento viés e va- riância. Além disso, αˆ muitas vezes consiste em um bom indicador do viés da estimativa para a precisão. Dessa forma, avaliamos o desempenho das nossas medidas por meio de estudos de simulações de Monte Carlo, e aplicamos alguns bancos de dados reais, comprovando na prática a eficácia dessas estatísticas. Notamos que a avaliação conjunta das estatística “BV” e “αˆ ” é o que determina o processo de seleção que estamos propondo.
id UFPE_8ea2eb03ecbc27db6879af5480319e4c
oai_identifier_str oai:repositorio.ufpe.br:123456789/44594
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling SILVA, Fernanda Clotilde dahttp://lattes.cnpq.br/1237676696598528http://lattes.cnpq.br/5451260154742484OSPINA, Patrícia Leone Espinheira2022-05-26T19:16:53Z2022-05-26T19:16:53Z2022-02-16SILVA, Fernanda Clotilde da. Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade. 2022. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/44594ark:/64986/001300000jh5mMuitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0,1), nessas situações podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que se baseia em supor que a variável resposta segue uma distribuição beta, sob uma nova parametrização. Alguns métodos de análise de diagnóstico foram desenvol- vidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas. Entretanto, o uso desses métodos geralmente se- gue após a escolha de um conjunto de variáveis explicativas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e algumas medidas usadas como critérios de seleção têm sido desenvolvidas. Dentre elas destacam-se os pseudos R2, que visam avaliar a proporção de variação da resposta explicada pelo modelo ajustado, essas medidas foram estu- dadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos beta. Além dessas quantidades, também dispomos do critério de seleção P2, que busca avaliar a habilidade do modelo em predizer valores consistentes da variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) para o modelo normal linear, e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição des- ses critérios baseia-se no poder de explicação da variabilidade ou no poder de predição, esse trabalho tem como objetivo propor um processo de seleção para a classe de modelos beta con- siderando ambos os interesses, isto é, apresentar uma medida capaz de indicar modelos que consigam explicar bem a variabilidade da resposta, logo apresentam bons ajustes, e também consigam predizer bons valores. Esse processo consiste em determinar uma constante cha- mada “αˆ ”, obtido com base no método bootstrap paramétrico, usada para construir uma nova estatística chamada “BV” (Bias and Variability), que diz respeito ao balanceamento viés e va- riância. Além disso, αˆ muitas vezes consiste em um bom indicador do viés da estimativa para a precisão. Dessa forma, avaliamos o desempenho das nossas medidas por meio de estudos de simulações de Monte Carlo, e aplicamos alguns bancos de dados reais, comprovando na prática a eficácia dessas estatísticas. Notamos que a avaliação conjunta das estatística “BV” e “αˆ ” é o que determina o processo de seleção que estamos propondo.CAPESMany times the need arises to study data whose values belong to the interval (0,1), in these situations we can opt to use the beta regression model, proposed by Ferrari and Cribari-Neto (2004), which is based on assuming that the response variable follows a beta distribution, under a new parameterization. Some diagnostic analysis methods have been developed for this class of models, seeking to verify the adequacy of the fit, identifying possible deviations from the assumptions made. However, the use of these methods usually follows after the choice of a set of explanatory variables relevant to the model, this procedure is known as model selection, and some measures used as selection criteria have been developed. Among them we highlight the pseudo R2, which aims to evaluate the proportion of variation of the response explained by the fitted model, these measures have been studied and implemented by Bayer and Cribari-Neto (2017) for the class of beta models. In addition these quantities, we also have the selection criterion P2, which seeks to evaluate the ability of the model to predict consistent values of the response variable, based on the PRESS statistic (Predictive Residual Sum of Squares), proposed by Allen (1971) for the linear normal model, and introduced to beta models by Espinheira et al. (2019). Since the definition of these criteria is based on the power to explain the variability or in the power of prediction, this work aims to propose a selection process for the class of beta models considering both interests, that is, to present a measure capable of indicating models that can explain well the variability of the response, therefore present good fits, and also manage to predict good values. This process consists in determining a constant called “αˆ ”, obtained from the parametric bootstrap method, used to construct a new statistic called “BV” (Bias and Variability), which is concerned with balancing bias and variance. In addition, “αˆ ” is often a good indicator of the bias of the estimate for precision. Thus, we evaluate the performance of our measures through Monte Carlo simulation studies, and apply some real databases, proving in practice the effectiveness of these statistics. We note that the joint evaluation of the “BV” and “αˆ ” statistics is what determines the selection process we are proposing.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessEstatística AplicadaOverfittingPrediçãoVariabilidadeRegressão betaUm critério de seleção para modelos beta baseado no trade-off predição e variabilidadeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETEXTTESE Fernanda Clotilde da Silva.pdf.txtTESE Fernanda Clotilde da Silva.pdf.txtExtracted texttext/plain265439https://repositorio.ufpe.br/bitstream/123456789/44594/4/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.txta00140ae18ebb66502d36c472164de8cMD54THUMBNAILTESE Fernanda Clotilde da Silva.pdf.jpgTESE Fernanda Clotilde da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1220https://repositorio.ufpe.br/bitstream/123456789/44594/5/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.jpg7f1e6ffa8bcde4137f3e492df7abf564MD55ORIGINALTESE Fernanda Clotilde da Silva.pdfTESE Fernanda Clotilde da Silva.pdfapplication/pdf3926605https://repositorio.ufpe.br/bitstream/123456789/44594/1/TESE%20Fernanda%20Clotilde%20da%20Silva.pdff99ca373c2a15ae80e571fad5413a88cMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82142https://repositorio.ufpe.br/bitstream/123456789/44594/3/license.txt6928b9260b07fb2755249a5ca9903395MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/44594/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52123456789/445942022-05-27 02:19:52.638oai:repositorio.ufpe.br:123456789/44594VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBEb2N1bWVudG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUKIAoKRGVjbGFybyBlc3RhciBjaWVudGUgZGUgcXVlIGVzdGUgVGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyB0ZW0gbyBvYmpldGl2byBkZSBkaXZ1bGdhw6fDo28gZG9zIGRvY3VtZW50b3MgZGVwb3NpdGFkb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBlIGRlY2xhcm8gcXVlOgoKSSAtICBvIGNvbnRlw7pkbyBkaXNwb25pYmlsaXphZG8gw6kgZGUgcmVzcG9uc2FiaWxpZGFkZSBkZSBzdWEgYXV0b3JpYTsKCklJIC0gbyBjb250ZcO6ZG8gw6kgb3JpZ2luYWwsIGUgc2UgbyB0cmFiYWxobyBlL291IHBhbGF2cmFzIGRlIG91dHJhcyBwZXNzb2FzIGZvcmFtIHV0aWxpemFkb3MsIGVzdGFzIGZvcmFtIGRldmlkYW1lbnRlIHJlY29uaGVjaWRhczsKCklJSSAtIHF1YW5kbyB0cmF0YXItc2UgZGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgRGlzc2VydGHDp8OjbyBvdSBUZXNlOiBvIGFycXVpdm8gZGVwb3NpdGFkbyBjb3JyZXNwb25kZSDDoCB2ZXJzw6NvIGZpbmFsIGRvIHRyYWJhbGhvOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogZXN0b3UgY2llbnRlIGRlIHF1ZSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIGRvY3VtZW50byBhcMOzcyBvIGRlcMOzc2l0byBlIGFudGVzIGRlIGZpbmRhciBvIHBlcsOtb2RvIGRlIGVtYmFyZ28sIHF1YW5kbyBmb3IgZXNjb2xoaWRvIGFjZXNzbyByZXN0cml0bywgc2Vyw6EgcGVybWl0aWRhIG1lZGlhbnRlIHNvbGljaXRhw6fDo28gZG8gKGEpIGF1dG9yIChhKSBhbyBTaXN0ZW1hIEludGVncmFkbyBkZSBCaWJsaW90ZWNhcyBkYSBVRlBFIChTSUIvVUZQRSkuCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBBYmVydG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBSZXN0cml0bzoKCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgZG9jdW1lbnRvLCBmdW5kYW1lbnRhZG8gbmEgTGVpIGRlIERpcmVpdG8gQXV0b3JhbCBubyA5LjYxMCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIHF1YW5kbyBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvIGNvbmRpemVudGUgYW8gdGlwbyBkZSBkb2N1bWVudG8sIGNvbmZvcm1lIGluZGljYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212022-05-27T05:19:52Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
title Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
spellingShingle Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
SILVA, Fernanda Clotilde da
Estatística Aplicada
Overfitting
Predição
Variabilidade
Regressão beta
title_short Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
title_full Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
title_fullStr Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
title_full_unstemmed Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
title_sort Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
author SILVA, Fernanda Clotilde da
author_facet SILVA, Fernanda Clotilde da
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1237676696598528
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5451260154742484
dc.contributor.author.fl_str_mv SILVA, Fernanda Clotilde da
dc.contributor.advisor1.fl_str_mv OSPINA, Patrícia Leone Espinheira
contributor_str_mv OSPINA, Patrícia Leone Espinheira
dc.subject.por.fl_str_mv Estatística Aplicada
Overfitting
Predição
Variabilidade
Regressão beta
topic Estatística Aplicada
Overfitting
Predição
Variabilidade
Regressão beta
description Muitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0,1), nessas situações podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que se baseia em supor que a variável resposta segue uma distribuição beta, sob uma nova parametrização. Alguns métodos de análise de diagnóstico foram desenvol- vidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas. Entretanto, o uso desses métodos geralmente se- gue após a escolha de um conjunto de variáveis explicativas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e algumas medidas usadas como critérios de seleção têm sido desenvolvidas. Dentre elas destacam-se os pseudos R2, que visam avaliar a proporção de variação da resposta explicada pelo modelo ajustado, essas medidas foram estu- dadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos beta. Além dessas quantidades, também dispomos do critério de seleção P2, que busca avaliar a habilidade do modelo em predizer valores consistentes da variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) para o modelo normal linear, e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição des- ses critérios baseia-se no poder de explicação da variabilidade ou no poder de predição, esse trabalho tem como objetivo propor um processo de seleção para a classe de modelos beta con- siderando ambos os interesses, isto é, apresentar uma medida capaz de indicar modelos que consigam explicar bem a variabilidade da resposta, logo apresentam bons ajustes, e também consigam predizer bons valores. Esse processo consiste em determinar uma constante cha- mada “αˆ ”, obtido com base no método bootstrap paramétrico, usada para construir uma nova estatística chamada “BV” (Bias and Variability), que diz respeito ao balanceamento viés e va- riância. Além disso, αˆ muitas vezes consiste em um bom indicador do viés da estimativa para a precisão. Dessa forma, avaliamos o desempenho das nossas medidas por meio de estudos de simulações de Monte Carlo, e aplicamos alguns bancos de dados reais, comprovando na prática a eficácia dessas estatísticas. Notamos que a avaliação conjunta das estatística “BV” e “αˆ ” é o que determina o processo de seleção que estamos propondo.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-05-26T19:16:53Z
dc.date.available.fl_str_mv 2022-05-26T19:16:53Z
dc.date.issued.fl_str_mv 2022-02-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Fernanda Clotilde da. Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade. 2022. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/44594
dc.identifier.dark.fl_str_mv ark:/64986/001300000jh5m
identifier_str_mv SILVA, Fernanda Clotilde da. Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade. 2022. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.
ark:/64986/001300000jh5m
url https://repositorio.ufpe.br/handle/123456789/44594
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv embargoedAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Estatistica
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/44594/4/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/44594/5/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/44594/1/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf
https://repositorio.ufpe.br/bitstream/123456789/44594/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/44594/2/license_rdf
bitstream.checksum.fl_str_mv a00140ae18ebb66502d36c472164de8c
7f1e6ffa8bcde4137f3e492df7abf564
f99ca373c2a15ae80e571fad5413a88c
6928b9260b07fb2755249a5ca9903395
e39d27027a6cc9cb039ad269a5db8e34
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172837585977344