Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
dARK ID: | ark:/64986/001300000sf32 |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/44275 |
Resumo: | Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido objeto de estudo de diversos autores devido a sua relevância para a modelagem de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1). No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al. (2008) apresentaram a definição de resíduos baseados no processo iterativo Scoring de Fisher, sendo esta amplamente utilizada para a generalização e proposição de novos resíduos para as extensões dos modelos de regressão beta. Com o foco na distribuição de probabilidade e observando que a mesma forma uma família exponencial bidimensional, utilizamos o Teorema da Função Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para propor uma nova classe de resíduos e critérios do tipo pseudo-R2 baseados nas estatísticas suficientes e completas com a finalidade de avaliar a variabilidade e aderência, além de realizar diagnósticos em modelos de aprendizado de máquina (machine learning) com distribuição beta. Além disso, para o modelo de regressão beta, propomos um novo resíduo baseado no processo iterativo Scoring de Fisher. Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de predição P2, introduzido por Espinheira et al. (2019) para a classe de modelos de regressão beta lineares e não-lineares. O desempenho das propostas é avaliado por meio de três aplicações, associadas a um conjunto de dados reais, relativas ao estudo do risco à doenças cardíacas. |
id |
UFPE_0084b039c0835f81b59847056fb8ba0a |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/44275 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
CAVALCANTE, Jaime Phasquinel Lopeshttp://lattes.cnpq.br/1429711314253485http://lattes.cnpq.br/5451260154742484OSPINA, Patrícia Leone Espinheira2022-05-03T19:15:13Z2022-05-03T19:15:13Z2022-02-07CAVALCANTE, Jaime Phasquinel Lopes. Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta. 2022. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/44275ark:/64986/001300000sf32Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido objeto de estudo de diversos autores devido a sua relevância para a modelagem de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1). No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al. (2008) apresentaram a definição de resíduos baseados no processo iterativo Scoring de Fisher, sendo esta amplamente utilizada para a generalização e proposição de novos resíduos para as extensões dos modelos de regressão beta. Com o foco na distribuição de probabilidade e observando que a mesma forma uma família exponencial bidimensional, utilizamos o Teorema da Função Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para propor uma nova classe de resíduos e critérios do tipo pseudo-R2 baseados nas estatísticas suficientes e completas com a finalidade de avaliar a variabilidade e aderência, além de realizar diagnósticos em modelos de aprendizado de máquina (machine learning) com distribuição beta. Além disso, para o modelo de regressão beta, propomos um novo resíduo baseado no processo iterativo Scoring de Fisher. Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de predição P2, introduzido por Espinheira et al. (2019) para a classe de modelos de regressão beta lineares e não-lineares. O desempenho das propostas é avaliado por meio de três aplicações, associadas a um conjunto de dados reais, relativas ao estudo do risco à doenças cardíacas.CNPqProposed by Ferrari and Cribari-Neto (2004), the beta regression model has been the object of study by several authors due to its relevance for the modeling of phenomena whose response variable is defined in the unit interval (0.1). With a diagnostic focus on beta regression models, Espinheira et al. (2008) presented the definition of residuals based on Fisher’s Scoring iterative process, which is widely used for the generalization and proposition of new residuals for the extensions of the models of beta regression. Aiming at the probability distribution we verify that the same form a two-dimensional exponential family, we use the Integrable Function Theorem - demonstrated by Barndorff-Nielsen (1978) and Lehmann (1986) - to propose a new class of residues and criteria R2 type based on sufficient and complete statistics in order to assess variability and adherence, in addition to performing diagnostic in machine learning models with beta distribution. Furthermore, for the beta regression model, we propose a new residual based on Fisher’s Scoring iterative process. As for the predictive quality, we used the PRESS statistic and the prediction coefficient P2, introduced by Espinheira et al. (2019) for the class of linear and non-linear beta regression models. The performance of the proposals is evaluated through three applications, associated with a set of real data, related to the study of the risk of cardiovascular diseases.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProbabilidadeRegressão betaVariabilidade e aderência em modelos de aprendizado de máquina com distribuição betainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPECC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/44275/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdfDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdfapplication/pdf2416490https://repositorio.ufpe.br/bitstream/123456789/44275/1/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf18f8a934607bfdb8e424c67d30dd9df2MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82142https://repositorio.ufpe.br/bitstream/123456789/44275/3/license.txt6928b9260b07fb2755249a5ca9903395MD53TEXTDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.txtDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.txtExtracted texttext/plain128128https://repositorio.ufpe.br/bitstream/123456789/44275/4/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.txt49db475b7d2c7f00df4321cdef09f1ecMD54THUMBNAILDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.jpgDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.jpgGenerated Thumbnailimage/jpeg1240https://repositorio.ufpe.br/bitstream/123456789/44275/5/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.jpgbb1c0040705fec1a2e6a66b241dac8c7MD55123456789/442752022-05-04 02:18:49.212oai:repositorio.ufpe.br:123456789/44275VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBEb2N1bWVudG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUKIAoKRGVjbGFybyBlc3RhciBjaWVudGUgZGUgcXVlIGVzdGUgVGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyB0ZW0gbyBvYmpldGl2byBkZSBkaXZ1bGdhw6fDo28gZG9zIGRvY3VtZW50b3MgZGVwb3NpdGFkb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBlIGRlY2xhcm8gcXVlOgoKSSAtICBvIGNvbnRlw7pkbyBkaXNwb25pYmlsaXphZG8gw6kgZGUgcmVzcG9uc2FiaWxpZGFkZSBkZSBzdWEgYXV0b3JpYTsKCklJIC0gbyBjb250ZcO6ZG8gw6kgb3JpZ2luYWwsIGUgc2UgbyB0cmFiYWxobyBlL291IHBhbGF2cmFzIGRlIG91dHJhcyBwZXNzb2FzIGZvcmFtIHV0aWxpemFkb3MsIGVzdGFzIGZvcmFtIGRldmlkYW1lbnRlIHJlY29uaGVjaWRhczsKCklJSSAtIHF1YW5kbyB0cmF0YXItc2UgZGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgRGlzc2VydGHDp8OjbyBvdSBUZXNlOiBvIGFycXVpdm8gZGVwb3NpdGFkbyBjb3JyZXNwb25kZSDDoCB2ZXJzw6NvIGZpbmFsIGRvIHRyYWJhbGhvOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogZXN0b3UgY2llbnRlIGRlIHF1ZSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIGRvY3VtZW50byBhcMOzcyBvIGRlcMOzc2l0byBlIGFudGVzIGRlIGZpbmRhciBvIHBlcsOtb2RvIGRlIGVtYmFyZ28sIHF1YW5kbyBmb3IgZXNjb2xoaWRvIGFjZXNzbyByZXN0cml0bywgc2Vyw6EgcGVybWl0aWRhIG1lZGlhbnRlIHNvbGljaXRhw6fDo28gZG8gKGEpIGF1dG9yIChhKSBhbyBTaXN0ZW1hIEludGVncmFkbyBkZSBCaWJsaW90ZWNhcyBkYSBVRlBFIChTSUIvVUZQRSkuCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBBYmVydG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBSZXN0cml0bzoKCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgZG9jdW1lbnRvLCBmdW5kYW1lbnRhZG8gbmEgTGVpIGRlIERpcmVpdG8gQXV0b3JhbCBubyA5LjYxMCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIHF1YW5kbyBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvIGNvbmRpemVudGUgYW8gdGlwbyBkZSBkb2N1bWVudG8sIGNvbmZvcm1lIGluZGljYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212022-05-04T05:18:49Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta |
title |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta |
spellingShingle |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta CAVALCANTE, Jaime Phasquinel Lopes Probabilidade Regressão beta |
title_short |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta |
title_full |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta |
title_fullStr |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta |
title_full_unstemmed |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta |
title_sort |
Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta |
author |
CAVALCANTE, Jaime Phasquinel Lopes |
author_facet |
CAVALCANTE, Jaime Phasquinel Lopes |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1429711314253485 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5451260154742484 |
dc.contributor.author.fl_str_mv |
CAVALCANTE, Jaime Phasquinel Lopes |
dc.contributor.advisor1.fl_str_mv |
OSPINA, Patrícia Leone Espinheira |
contributor_str_mv |
OSPINA, Patrícia Leone Espinheira |
dc.subject.por.fl_str_mv |
Probabilidade Regressão beta |
topic |
Probabilidade Regressão beta |
description |
Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido objeto de estudo de diversos autores devido a sua relevância para a modelagem de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1). No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al. (2008) apresentaram a definição de resíduos baseados no processo iterativo Scoring de Fisher, sendo esta amplamente utilizada para a generalização e proposição de novos resíduos para as extensões dos modelos de regressão beta. Com o foco na distribuição de probabilidade e observando que a mesma forma uma família exponencial bidimensional, utilizamos o Teorema da Função Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para propor uma nova classe de resíduos e critérios do tipo pseudo-R2 baseados nas estatísticas suficientes e completas com a finalidade de avaliar a variabilidade e aderência, além de realizar diagnósticos em modelos de aprendizado de máquina (machine learning) com distribuição beta. Além disso, para o modelo de regressão beta, propomos um novo resíduo baseado no processo iterativo Scoring de Fisher. Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de predição P2, introduzido por Espinheira et al. (2019) para a classe de modelos de regressão beta lineares e não-lineares. O desempenho das propostas é avaliado por meio de três aplicações, associadas a um conjunto de dados reais, relativas ao estudo do risco à doenças cardíacas. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-05-03T19:15:13Z |
dc.date.available.fl_str_mv |
2022-05-03T19:15:13Z |
dc.date.issued.fl_str_mv |
2022-02-07 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CAVALCANTE, Jaime Phasquinel Lopes. Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta. 2022. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/44275 |
dc.identifier.dark.fl_str_mv |
ark:/64986/001300000sf32 |
identifier_str_mv |
CAVALCANTE, Jaime Phasquinel Lopes. Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta. 2022. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022. ark:/64986/001300000sf32 |
url |
https://repositorio.ufpe.br/handle/123456789/44275 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Estatistica |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/44275/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/44275/1/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf https://repositorio.ufpe.br/bitstream/123456789/44275/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/44275/4/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/44275/5/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.jpg |
bitstream.checksum.fl_str_mv |
e39d27027a6cc9cb039ad269a5db8e34 18f8a934607bfdb8e424c67d30dd9df2 6928b9260b07fb2755249a5ca9903395 49db475b7d2c7f00df4321cdef09f1ec bb1c0040705fec1a2e6a66b241dac8c7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1815172905130000384 |