Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta

Detalhes bibliográficos
Autor(a) principal: CAVALCANTE, Jaime Phasquinel Lopes
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300000sf32
Texto Completo: https://repositorio.ufpe.br/handle/123456789/44275
Resumo: Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido objeto de estudo de diversos autores devido a sua relevância para a modelagem de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1). No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al. (2008) apresentaram a definição de resíduos baseados no processo iterativo Scoring de Fisher, sendo esta amplamente utilizada para a generalização e proposição de novos resíduos para as extensões dos modelos de regressão beta. Com o foco na distribuição de probabilidade e observando que a mesma forma uma família exponencial bidimensional, utilizamos o Teorema da Função Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para propor uma nova classe de resíduos e critérios do tipo pseudo-R2 baseados nas estatísticas suficientes e completas com a finalidade de avaliar a variabilidade e aderência, além de realizar diagnósticos em modelos de aprendizado de máquina (machine learning) com distribuição beta. Além disso, para o modelo de regressão beta, propomos um novo resíduo baseado no processo iterativo Scoring de Fisher. Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de predição P2, introduzido por Espinheira et al. (2019) para a classe de modelos de regressão beta lineares e não-lineares. O desempenho das propostas é avaliado por meio de três aplicações, associadas a um conjunto de dados reais, relativas ao estudo do risco à doenças cardíacas.
id UFPE_0084b039c0835f81b59847056fb8ba0a
oai_identifier_str oai:repositorio.ufpe.br:123456789/44275
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling CAVALCANTE, Jaime Phasquinel Lopeshttp://lattes.cnpq.br/1429711314253485http://lattes.cnpq.br/5451260154742484OSPINA, Patrícia Leone Espinheira2022-05-03T19:15:13Z2022-05-03T19:15:13Z2022-02-07CAVALCANTE, Jaime Phasquinel Lopes. Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta. 2022. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.https://repositorio.ufpe.br/handle/123456789/44275ark:/64986/001300000sf32Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido objeto de estudo de diversos autores devido a sua relevância para a modelagem de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1). No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al. (2008) apresentaram a definição de resíduos baseados no processo iterativo Scoring de Fisher, sendo esta amplamente utilizada para a generalização e proposição de novos resíduos para as extensões dos modelos de regressão beta. Com o foco na distribuição de probabilidade e observando que a mesma forma uma família exponencial bidimensional, utilizamos o Teorema da Função Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para propor uma nova classe de resíduos e critérios do tipo pseudo-R2 baseados nas estatísticas suficientes e completas com a finalidade de avaliar a variabilidade e aderência, além de realizar diagnósticos em modelos de aprendizado de máquina (machine learning) com distribuição beta. Além disso, para o modelo de regressão beta, propomos um novo resíduo baseado no processo iterativo Scoring de Fisher. Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de predição P2, introduzido por Espinheira et al. (2019) para a classe de modelos de regressão beta lineares e não-lineares. O desempenho das propostas é avaliado por meio de três aplicações, associadas a um conjunto de dados reais, relativas ao estudo do risco à doenças cardíacas.CNPqProposed by Ferrari and Cribari-Neto (2004), the beta regression model has been the object of study by several authors due to its relevance for the modeling of phenomena whose response variable is defined in the unit interval (0.1). With a diagnostic focus on beta regression models, Espinheira et al. (2008) presented the definition of residuals based on Fisher’s Scoring iterative process, which is widely used for the generalization and proposition of new residuals for the extensions of the models of beta regression. Aiming at the probability distribution we verify that the same form a two-dimensional exponential family, we use the Integrable Function Theorem - demonstrated by Barndorff-Nielsen (1978) and Lehmann (1986) - to propose a new class of residues and criteria R2 type based on sufficient and complete statistics in order to assess variability and adherence, in addition to performing diagnostic in machine learning models with beta distribution. Furthermore, for the beta regression model, we propose a new residual based on Fisher’s Scoring iterative process. As for the predictive quality, we used the PRESS statistic and the prediction coefficient P2, introduced by Espinheira et al. (2019) for the class of linear and non-linear beta regression models. The performance of the proposals is evaluated through three applications, associated with a set of real data, related to the study of the risk of cardiovascular diseases.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProbabilidadeRegressão betaVariabilidade e aderência em modelos de aprendizado de máquina com distribuição betainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPECC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/44275/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52ORIGINALDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdfDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdfapplication/pdf2416490https://repositorio.ufpe.br/bitstream/123456789/44275/1/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf18f8a934607bfdb8e424c67d30dd9df2MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82142https://repositorio.ufpe.br/bitstream/123456789/44275/3/license.txt6928b9260b07fb2755249a5ca9903395MD53TEXTDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.txtDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.txtExtracted texttext/plain128128https://repositorio.ufpe.br/bitstream/123456789/44275/4/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.txt49db475b7d2c7f00df4321cdef09f1ecMD54THUMBNAILDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.jpgDISSERTAÇÃO Jaime Phasquinel Lopes Cavalcante.pdf.jpgGenerated Thumbnailimage/jpeg1240https://repositorio.ufpe.br/bitstream/123456789/44275/5/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.jpgbb1c0040705fec1a2e6a66b241dac8c7MD55123456789/442752022-05-04 02:18:49.212oai:repositorio.ufpe.br:123456789/44275VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBkZSBEb2N1bWVudG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUKIAoKRGVjbGFybyBlc3RhciBjaWVudGUgZGUgcXVlIGVzdGUgVGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyB0ZW0gbyBvYmpldGl2byBkZSBkaXZ1bGdhw6fDo28gZG9zIGRvY3VtZW50b3MgZGVwb3NpdGFkb3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBlIGRlY2xhcm8gcXVlOgoKSSAtICBvIGNvbnRlw7pkbyBkaXNwb25pYmlsaXphZG8gw6kgZGUgcmVzcG9uc2FiaWxpZGFkZSBkZSBzdWEgYXV0b3JpYTsKCklJIC0gbyBjb250ZcO6ZG8gw6kgb3JpZ2luYWwsIGUgc2UgbyB0cmFiYWxobyBlL291IHBhbGF2cmFzIGRlIG91dHJhcyBwZXNzb2FzIGZvcmFtIHV0aWxpemFkb3MsIGVzdGFzIGZvcmFtIGRldmlkYW1lbnRlIHJlY29uaGVjaWRhczsKCklJSSAtIHF1YW5kbyB0cmF0YXItc2UgZGUgVHJhYmFsaG8gZGUgQ29uY2x1c8OjbyBkZSBDdXJzbywgRGlzc2VydGHDp8OjbyBvdSBUZXNlOiBvIGFycXVpdm8gZGVwb3NpdGFkbyBjb3JyZXNwb25kZSDDoCB2ZXJzw6NvIGZpbmFsIGRvIHRyYWJhbGhvOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogZXN0b3UgY2llbnRlIGRlIHF1ZSBhIGFsdGVyYcOnw6NvIGRhIG1vZGFsaWRhZGUgZGUgYWNlc3NvIGFvIGRvY3VtZW50byBhcMOzcyBvIGRlcMOzc2l0byBlIGFudGVzIGRlIGZpbmRhciBvIHBlcsOtb2RvIGRlIGVtYmFyZ28sIHF1YW5kbyBmb3IgZXNjb2xoaWRvIGFjZXNzbyByZXN0cml0bywgc2Vyw6EgcGVybWl0aWRhIG1lZGlhbnRlIHNvbGljaXRhw6fDo28gZG8gKGEpIGF1dG9yIChhKSBhbyBTaXN0ZW1hIEludGVncmFkbyBkZSBCaWJsaW90ZWNhcyBkYSBVRlBFIChTSUIvVUZQRSkuCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBBYmVydG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBhcnQuIDI5LCBpbmNpc28gSUlJLCBhdXRvcml6byBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFBlcm5hbWJ1Y28gYSBkaXNwb25pYmlsaXphciBncmF0dWl0YW1lbnRlLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMsIHBhcmEgZmlucyBkZSBsZWl0dXJhLCBpbXByZXNzw6NvIGUvb3UgZG93bmxvYWQgKGFxdWlzacOnw6NvKSBhdHJhdsOpcyBkbyBzaXRlIGRvIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgbm8gZW5kZXJlw6dvIGh0dHA6Ly93d3cucmVwb3NpdG9yaW8udWZwZS5iciwgYSBwYXJ0aXIgZGEgZGF0YSBkZSBkZXDDs3NpdG8uCgogClBhcmEgdHJhYmFsaG9zIGVtIEFjZXNzbyBSZXN0cml0bzoKCk5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkZSBhdXRvciBxdWUgcmVjYWVtIHNvYnJlIGVzdGUgZG9jdW1lbnRvLCBmdW5kYW1lbnRhZG8gbmEgTGVpIGRlIERpcmVpdG8gQXV0b3JhbCBubyA5LjYxMCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIHF1YW5kbyBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvIGNvbmRpemVudGUgYW8gdGlwbyBkZSBkb2N1bWVudG8sIGNvbmZvcm1lIGluZGljYWRvIG5vIGNhbXBvIERhdGEgZGUgRW1iYXJnby4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212022-05-04T05:18:49Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
title Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
spellingShingle Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
CAVALCANTE, Jaime Phasquinel Lopes
Probabilidade
Regressão beta
title_short Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
title_full Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
title_fullStr Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
title_full_unstemmed Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
title_sort Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta
author CAVALCANTE, Jaime Phasquinel Lopes
author_facet CAVALCANTE, Jaime Phasquinel Lopes
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1429711314253485
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5451260154742484
dc.contributor.author.fl_str_mv CAVALCANTE, Jaime Phasquinel Lopes
dc.contributor.advisor1.fl_str_mv OSPINA, Patrícia Leone Espinheira
contributor_str_mv OSPINA, Patrícia Leone Espinheira
dc.subject.por.fl_str_mv Probabilidade
Regressão beta
topic Probabilidade
Regressão beta
description Proposto por Ferrari e Cribari-Neto (2004), o modelo de regressão beta tem sido objeto de estudo de diversos autores devido a sua relevância para a modelagem de fenômenos cuja variável resposta esteja definida no intervalo unitário (0,1). No tocante ao diagnóstico dos modelos de regressão beta, Espinheira et al. (2008) apresentaram a definição de resíduos baseados no processo iterativo Scoring de Fisher, sendo esta amplamente utilizada para a generalização e proposição de novos resíduos para as extensões dos modelos de regressão beta. Com o foco na distribuição de probabilidade e observando que a mesma forma uma família exponencial bidimensional, utilizamos o Teorema da Função Integrável - demonstrado por Barndorff-Nielsen (1978) e Lehmann (1986) - para propor uma nova classe de resíduos e critérios do tipo pseudo-R2 baseados nas estatísticas suficientes e completas com a finalidade de avaliar a variabilidade e aderência, além de realizar diagnósticos em modelos de aprendizado de máquina (machine learning) com distribuição beta. Além disso, para o modelo de regressão beta, propomos um novo resíduo baseado no processo iterativo Scoring de Fisher. Quanto à qualidade preditiva, utilizamos a estatística PRESS e o coeficiente de predição P2, introduzido por Espinheira et al. (2019) para a classe de modelos de regressão beta lineares e não-lineares. O desempenho das propostas é avaliado por meio de três aplicações, associadas a um conjunto de dados reais, relativas ao estudo do risco à doenças cardíacas.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-05-03T19:15:13Z
dc.date.available.fl_str_mv 2022-05-03T19:15:13Z
dc.date.issued.fl_str_mv 2022-02-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CAVALCANTE, Jaime Phasquinel Lopes. Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta. 2022. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/44275
dc.identifier.dark.fl_str_mv ark:/64986/001300000sf32
identifier_str_mv CAVALCANTE, Jaime Phasquinel Lopes. Variabilidade e aderência em modelos de aprendizado de máquina com distribuição beta. 2022. Dissertação (Mestrado em Estatística) - Universidade Federal de Pernambuco, Recife, 2022.
ark:/64986/001300000sf32
url https://repositorio.ufpe.br/handle/123456789/44275
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Estatistica
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/44275/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/44275/1/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf
https://repositorio.ufpe.br/bitstream/123456789/44275/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/44275/4/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/44275/5/DISSERTA%c3%87%c3%83O%20Jaime%20Phasquinel%20Lopes%20Cavalcante.pdf.jpg
bitstream.checksum.fl_str_mv e39d27027a6cc9cb039ad269a5db8e34
18f8a934607bfdb8e424c67d30dd9df2
6928b9260b07fb2755249a5ca9903395
49db475b7d2c7f00df4321cdef09f1ec
bb1c0040705fec1a2e6a66b241dac8c7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172905130000384