Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/001300000jh5m |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/44594 |
Resumo: | Muitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0,1), nessas situações podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que se baseia em supor que a variável resposta segue uma distribuição beta, sob uma nova parametrização. Alguns métodos de análise de diagnóstico foram desenvol- vidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas. Entretanto, o uso desses métodos geralmente se- gue após a escolha de um conjunto de variáveis explicativas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e algumas medidas usadas como critérios de seleção têm sido desenvolvidas. Dentre elas destacam-se os pseudos R2, que visam avaliar a proporção de variação da resposta explicada pelo modelo ajustado, essas medidas foram estu- dadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos beta. Além dessas quantidades, também dispomos do critério de seleção P2, que busca avaliar a habilidade do modelo em predizer valores consistentes da variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) para o modelo normal linear, e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição des- ses critérios baseia-se no poder de explicação da variabilidade ou no poder de predição, esse trabalho tem como objetivo propor um processo de seleção para a classe de modelos beta con- siderando ambos os interesses, isto é, apresentar uma medida capaz de indicar modelos que consigam explicar bem a variabilidade da resposta, logo apresentam bons ajustes, e também consigam predizer bons valores. Esse processo consiste em determinar uma constante cha- mada “αˆ ”, obtido com base no método bootstrap paramétrico, usada para construir uma nova estatística chamada “BV” (Bias and Variability), que diz respeito ao balanceamento viés e va- riância. Além disso, αˆ muitas vezes consiste em um bom indicador do viés da estimativa para a precisão. Dessa forma, avaliamos o desempenho das nossas medidas por meio de estudos de simulações de Monte Carlo, e aplicamos alguns bancos de dados reais, comprovando na prática a eficácia dessas estatísticas. Notamos que a avaliação conjunta das estatística “BV” e “αˆ ” é o que determina o processo de seleção que estamos propondo. |
id |
UFPE_8ea2eb03ecbc27db6879af5480319e4c |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/44594 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
SILVA, Fernanda Clotilde dahttp://lattes.cnpq.br/1237676696598528http://lattes.cnpq.br/5451260154742484OSPINA, Patrícia Leone Espinheira2022-05-26T19:16:53Z2022-05-26T19:16:53Z2022-02-16SILVA, Fernanda Clotilde da. Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade. 2022. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/44594ark:/64986/001300000jh5mMuitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0,1), nessas situações podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que se baseia em supor que a variável resposta segue uma distribuição beta, sob uma nova parametrização. Alguns métodos de análise de diagnóstico foram desenvol- vidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas. Entretanto, o uso desses métodos geralmente se- gue após a escolha de um conjunto de variáveis explicativas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e algumas medidas usadas como critérios de seleção têm sido desenvolvidas. Dentre elas destacam-se os pseudos R2, que visam avaliar a proporção de variação da resposta explicada pelo modelo ajustado, essas medidas foram estu- dadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos beta. Além dessas quantidades, também dispomos do critério de seleção P2, que busca avaliar a habilidade do modelo em predizer valores consistentes da variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) para o modelo normal linear, e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição des- ses critérios baseia-se no poder de explicação da variabilidade ou no poder de predição, esse trabalho tem como objetivo propor um processo de seleção para a classe de modelos beta con- siderando ambos os interesses, isto é, apresentar uma medida capaz de indicar modelos que consigam explicar bem a variabilidade da resposta, logo apresentam bons ajustes, e também consigam predizer bons valores. Esse processo consiste em determinar uma constante cha- mada “αˆ ”, obtido com base no método bootstrap paramétrico, usada para construir uma nova estatística chamada “BV” (Bias and Variability), que diz respeito ao balanceamento viés e va- riância. Além disso, αˆ muitas vezes consiste em um bom indicador do viés da estimativa para a precisão. Dessa forma, avaliamos o desempenho das nossas medidas por meio de estudos de simulações de Monte Carlo, e aplicamos alguns bancos de dados reais, comprovando na prática a eficácia dessas estatísticas. Notamos que a avaliação conjunta das estatística “BV” e “αˆ ” é o que determina o processo de seleção que estamos propondo.CAPESMany times the need arises to study data whose values belong to the interval (0,1), in these situations we can opt to use the beta regression model, proposed by Ferrari and Cribari-Neto (2004), which is based on assuming that the response variable follows a beta distribution, under a new parameterization. Some diagnostic analysis methods have been developed for this class of models, seeking to verify the adequacy of the fit, identifying possible deviations from the assumptions made. However, the use of these methods usually follows after the choice of a set of explanatory variables relevant to the model, this procedure is known as model selection, and some measures used as selection criteria have been developed. Among them we highlight the pseudo R2, which aims to evaluate the proportion of variation of the response explained by the fitted model, these measures have been studied and implemented by Bayer and Cribari-Neto (2017) for the class of beta models. In addition these quantities, we also have the selection criterion P2, which seeks to evaluate the ability of the model to predict consistent values of the response variable, based on the PRESS statistic (Predictive Residual Sum of Squares), proposed by Allen (1971) for the linear normal model, and introduced to beta models by Espinheira et al. (2019). Since the definition of these criteria is based on the power to explain the variability or in the power of prediction, this work aims to propose a selection process for the class of beta models considering both interests, that is, to present a measure capable of indicating models that can explain well the variability of the response, therefore present good fits, and also manage to predict good values. This process consists in determining a constant called “αˆ ”, obtained from the parametric bootstrap method, used to construct a new statistic called “BV” (Bias and Variability), which is concerned with balancing bias and variance. In addition, “αˆ ” is often a good indicator of the bias of the estimate for precision. Thus, we evaluate the performance of our measures through Monte Carlo simulation studies, and apply some real databases, proving in practice the effectiveness of these statistics. We note that the joint evaluation of the “BV” and “αˆ ” statistics is what determines the selection process we are proposing.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessEstatística AplicadaOverfittingPrediçãoVariabilidadeRegressão betaUm critério de seleção para modelos beta baseado no trade-off predição e variabilidadeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETEXTTESE Fernanda Clotilde da Silva.pdf.txtTESE Fernanda Clotilde da Silva.pdf.txtExtracted texttext/plain265439https://repositorio.ufpe.br/bitstream/123456789/44594/4/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.txta00140ae18ebb66502d36c472164de8cMD54THUMBNAILTESE Fernanda Clotilde da Silva.pdf.jpgTESE Fernanda Clotilde da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1220https://repositorio.ufpe.br/bitstream/123456789/44594/5/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.jpg7f1e6ffa8bcde4137f3e492df7abf564MD55ORIGINALTESE Fernanda Clotilde da Silva.pdfTESE Fernanda Clotilde da Silva.pdfapplication/pdf3926605https://repositorio.ufpe.br/bitstream/123456789/44594/1/TESE%20Fernanda%20Clotilde%20da%20Silva.pdff99ca373c2a15ae80e571fad5413a88cMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82142https://repositorio.ufpe.br/bitstream/123456789/44594/3/license.txt6928b9260b07fb2755249a5ca9903395MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/44594/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52123456789/445942022-05-27 02:19:52.638oai:repositorio.ufpe.br:123456789/44594VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBEb2N1bWVudG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUKIAoKRGVjbGFybyBlc3RhciBjaWVudGUgZGUgcXVlIGVzdGUgVGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyB0ZW0gbyBvYmpldGl2byBkZSBkaXZ1bGdhw6fDo28gZG9zIGRvY3VtZW50b3MgZGVwb3NpdGFkb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBlIGRlY2xhcm8gcXVlOgoKSSAtICBvIGNvbnRlw7pkbyBkaXNwb25pYmlsaXphZG8gw6kgZGUgcmVzcG9uc2FiaWxpZGFkZSBkZSBzdWEgYXV0b3JpYTsKCklJIC0gbyBjb250ZcO6ZG8gw6kgb3JpZ2luYWwsIGUgc2UgbyB0cmFiYWxobyBlL291IHBhbGF2cmFzIGRlIG91dHJhcyBwZXNzb2FzIGZvcmFtIHV0aWxpemFkb3MsIGVzdGFzIGZvcmFtIGRldmlkYW1lbnRlIHJlY29uaGVjaWRhczsKCklJSSAtIHF1YW5kbyB0cmF0YXItc2UgZGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgRGlzc2VydGHDp8OjbyBvdSBUZXNlOiBvIGFycXVpdm8gZGVwb3NpdGFkbyBjb3JyZXNwb25kZSDDoCB2ZXJzw6NvIGZpbmFsIGRvIHRyYWJhbGhvOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogZXN0b3UgY2llbnRlIGRlIHF1ZSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIGRvY3VtZW50byBhcMOzcyBvIGRlcMOzc2l0byBlIGFudGVzIGRlIGZpbmRhciBvIHBlcsOtb2RvIGRlIGVtYmFyZ28sIHF1YW5kbyBmb3IgZXNjb2xoaWRvIGFjZXNzbyByZXN0cml0bywgc2Vyw6EgcGVybWl0aWRhIG1lZGlhbnRlIHNvbGljaXRhw6fDo28gZG8gKGEpIGF1dG9yIChhKSBhbyBTaXN0ZW1hIEludGVncmFkbyBkZSBCaWJsaW90ZWNhcyBkYSBVRlBFIChTSUIvVUZQRSkuCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBBYmVydG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBSZXN0cml0bzoKCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgZG9jdW1lbnRvLCBmdW5kYW1lbnRhZG8gbmEgTGVpIGRlIERpcmVpdG8gQXV0b3JhbCBubyA5LjYxMCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIHF1YW5kbyBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvIGNvbmRpemVudGUgYW8gdGlwbyBkZSBkb2N1bWVudG8sIGNvbmZvcm1lIGluZGljYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212022-05-27T05:19:52Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade |
title |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade |
spellingShingle |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade SILVA, Fernanda Clotilde da Estatística Aplicada Overfitting Predição Variabilidade Regressão beta |
title_short |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade |
title_full |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade |
title_fullStr |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade |
title_full_unstemmed |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade |
title_sort |
Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade |
author |
SILVA, Fernanda Clotilde da |
author_facet |
SILVA, Fernanda Clotilde da |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1237676696598528 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5451260154742484 |
dc.contributor.author.fl_str_mv |
SILVA, Fernanda Clotilde da |
dc.contributor.advisor1.fl_str_mv |
OSPINA, Patrícia Leone Espinheira |
contributor_str_mv |
OSPINA, Patrícia Leone Espinheira |
dc.subject.por.fl_str_mv |
Estatística Aplicada Overfitting Predição Variabilidade Regressão beta |
topic |
Estatística Aplicada Overfitting Predição Variabilidade Regressão beta |
description |
Muitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0,1), nessas situações podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que se baseia em supor que a variável resposta segue uma distribuição beta, sob uma nova parametrização. Alguns métodos de análise de diagnóstico foram desenvol- vidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas. Entretanto, o uso desses métodos geralmente se- gue após a escolha de um conjunto de variáveis explicativas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e algumas medidas usadas como critérios de seleção têm sido desenvolvidas. Dentre elas destacam-se os pseudos R2, que visam avaliar a proporção de variação da resposta explicada pelo modelo ajustado, essas medidas foram estu- dadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos beta. Além dessas quantidades, também dispomos do critério de seleção P2, que busca avaliar a habilidade do modelo em predizer valores consistentes da variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) para o modelo normal linear, e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição des- ses critérios baseia-se no poder de explicação da variabilidade ou no poder de predição, esse trabalho tem como objetivo propor um processo de seleção para a classe de modelos beta con- siderando ambos os interesses, isto é, apresentar uma medida capaz de indicar modelos que consigam explicar bem a variabilidade da resposta, logo apresentam bons ajustes, e também consigam predizer bons valores. Esse processo consiste em determinar uma constante cha- mada “αˆ ”, obtido com base no método bootstrap paramétrico, usada para construir uma nova estatística chamada “BV” (Bias and Variability), que diz respeito ao balanceamento viés e va- riância. Além disso, αˆ muitas vezes consiste em um bom indicador do viés da estimativa para a precisão. Dessa forma, avaliamos o desempenho das nossas medidas por meio de estudos de simulações de Monte Carlo, e aplicamos alguns bancos de dados reais, comprovando na prática a eficácia dessas estatísticas. Notamos que a avaliação conjunta das estatística “BV” e “αˆ ” é o que determina o processo de seleção que estamos propondo. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-05-26T19:16:53Z |
dc.date.available.fl_str_mv |
2022-05-26T19:16:53Z |
dc.date.issued.fl_str_mv |
2022-02-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Fernanda Clotilde da. Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade. 2022. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/44594 |
dc.identifier.dark.fl_str_mv |
ark:/64986/001300000jh5m |
identifier_str_mv |
SILVA, Fernanda Clotilde da. Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade. 2022. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022. ark:/64986/001300000jh5m |
url |
https://repositorio.ufpe.br/handle/123456789/44594 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/embargoedAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
embargoedAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Estatistica |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/44594/4/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/44594/5/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/44594/1/TESE%20Fernanda%20Clotilde%20da%20Silva.pdf https://repositorio.ufpe.br/bitstream/123456789/44594/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/44594/2/license_rdf |
bitstream.checksum.fl_str_mv |
a00140ae18ebb66502d36c472164de8c 7f1e6ffa8bcde4137f3e492df7abf564 f99ca373c2a15ae80e571fad5413a88c 6928b9260b07fb2755249a5ca9903395 e39d27027a6cc9cb039ad269a5db8e34 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172837585977344 |