Modelando a probabilidade de ocorrência de eventos raros

Detalhes bibliográficos
Autor(a) principal: Silva, André Ribeiro Pinheiro da
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/25275
Resumo: O modelo de regressão logística, surgiu na primeira metade do século XX, e é um dos mais populares para descrever a relação existente entre uma variável resposta binária e um conjunto de variáveis explicativas. Entretanto, é conhecido na literatura que este modelo apresenta problemas quando se trata da modelagem de um evento raro ou quando se trabalha com amostras pequenas. Um evento é considerado raro se a variável aleatória binária possui um número de ocorrências do evento de interesse (sucesso) consideravelmente mais baixo que o número de ocorrências de não interesse (fracassos). O desbalanceamento entre essas duas categorias, sucessos e fracassos, faz com que o modelo de regressão logística subestime a probabilidade de ocorrência do evento de interesse. Na literatura existem diversas alternativas apontadas para tentar solucionar este problema. A mais utilizada é o uso da abordagem de Firth à regressão logística. O objetivo deste trabalho é aplicar dois métodos de regressão logística para dados com cenários de eventos raros da área médica e financeira, buscando fazer uma comparação entre os métodos. A aplicação feita para a base médica busca compreender o impacto de fatores de risco, por exemplo, frequência cardíaca e colesterol, em doenças coronarianas. Já a aplicação feita para a base financeira, busca reconhecer transações fraudulentas com cartão de crédito por meio de variáveis explicativas resultantes de uma Análise de Componentes Principais (ACP) e outras, como por exemplo, o valor da transação e o tempo da primeira transação realizada. Os métodos de Regressão Logística usual e Regressão Logística de Firth (ou Abordagem de Firth) foram aplicados aos dois problemas e seus resultados comparados. Os dois métodos apresentaram resultados semelhantes, com uma pequena vantagem para a abordagem de Firth.
id UFF-2_2d328ab26435b518ec7c1ccf74a20d2d
oai_identifier_str oai:app.uff.br:1/25275
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Modelando a probabilidade de ocorrência de eventos rarosModelo de Regressão LogísticaEvento RaroAbordagem de FirthEstatísticaRegressão logísticaEstatística de saúdeEstatística econômicaO modelo de regressão logística, surgiu na primeira metade do século XX, e é um dos mais populares para descrever a relação existente entre uma variável resposta binária e um conjunto de variáveis explicativas. Entretanto, é conhecido na literatura que este modelo apresenta problemas quando se trata da modelagem de um evento raro ou quando se trabalha com amostras pequenas. Um evento é considerado raro se a variável aleatória binária possui um número de ocorrências do evento de interesse (sucesso) consideravelmente mais baixo que o número de ocorrências de não interesse (fracassos). O desbalanceamento entre essas duas categorias, sucessos e fracassos, faz com que o modelo de regressão logística subestime a probabilidade de ocorrência do evento de interesse. Na literatura existem diversas alternativas apontadas para tentar solucionar este problema. A mais utilizada é o uso da abordagem de Firth à regressão logística. O objetivo deste trabalho é aplicar dois métodos de regressão logística para dados com cenários de eventos raros da área médica e financeira, buscando fazer uma comparação entre os métodos. A aplicação feita para a base médica busca compreender o impacto de fatores de risco, por exemplo, frequência cardíaca e colesterol, em doenças coronarianas. Já a aplicação feita para a base financeira, busca reconhecer transações fraudulentas com cartão de crédito por meio de variáveis explicativas resultantes de uma Análise de Componentes Principais (ACP) e outras, como por exemplo, o valor da transação e o tempo da primeira transação realizada. Os métodos de Regressão Logística usual e Regressão Logística de Firth (ou Abordagem de Firth) foram aplicados aos dois problemas e seus resultados comparados. Os dois métodos apresentaram resultados semelhantes, com uma pequena vantagem para a abordagem de Firth.77 f.NiteróiPinto Junior, Jony ArraisPinto Junior, Jony ArraisCarvalho, Márcia Marques deKubrusly, Jessica QuintanilhaPinto Junior, Jony ArraisSilva, André Ribeiro Pinheiro da2022-06-20T16:00:06Z2022-06-20T16:00:06Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSILVA, André Ribeiro Pinheiro da. Modelando a probabilidade de ocorrência de eventos raros. 2021. 77 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.http://app.uff.br/riuff/handle/1/25275Aluno de Graduaçãohttp://creativecommons.org/licenses/by-nc-nd/3.0/br/CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-06-20T16:00:11Zoai:app.uff.br:1/25275Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:16:49.420619Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Modelando a probabilidade de ocorrência de eventos raros
title Modelando a probabilidade de ocorrência de eventos raros
spellingShingle Modelando a probabilidade de ocorrência de eventos raros
Silva, André Ribeiro Pinheiro da
Modelo de Regressão Logística
Evento Raro
Abordagem de Firth
Estatística
Regressão logística
Estatística de saúde
Estatística econômica
title_short Modelando a probabilidade de ocorrência de eventos raros
title_full Modelando a probabilidade de ocorrência de eventos raros
title_fullStr Modelando a probabilidade de ocorrência de eventos raros
title_full_unstemmed Modelando a probabilidade de ocorrência de eventos raros
title_sort Modelando a probabilidade de ocorrência de eventos raros
author Silva, André Ribeiro Pinheiro da
author_facet Silva, André Ribeiro Pinheiro da
author_role author
dc.contributor.none.fl_str_mv Pinto Junior, Jony Arrais
Pinto Junior, Jony Arrais
Carvalho, Márcia Marques de
Kubrusly, Jessica Quintanilha
Pinto Junior, Jony Arrais
dc.contributor.author.fl_str_mv Silva, André Ribeiro Pinheiro da
dc.subject.por.fl_str_mv Modelo de Regressão Logística
Evento Raro
Abordagem de Firth
Estatística
Regressão logística
Estatística de saúde
Estatística econômica
topic Modelo de Regressão Logística
Evento Raro
Abordagem de Firth
Estatística
Regressão logística
Estatística de saúde
Estatística econômica
description O modelo de regressão logística, surgiu na primeira metade do século XX, e é um dos mais populares para descrever a relação existente entre uma variável resposta binária e um conjunto de variáveis explicativas. Entretanto, é conhecido na literatura que este modelo apresenta problemas quando se trata da modelagem de um evento raro ou quando se trabalha com amostras pequenas. Um evento é considerado raro se a variável aleatória binária possui um número de ocorrências do evento de interesse (sucesso) consideravelmente mais baixo que o número de ocorrências de não interesse (fracassos). O desbalanceamento entre essas duas categorias, sucessos e fracassos, faz com que o modelo de regressão logística subestime a probabilidade de ocorrência do evento de interesse. Na literatura existem diversas alternativas apontadas para tentar solucionar este problema. A mais utilizada é o uso da abordagem de Firth à regressão logística. O objetivo deste trabalho é aplicar dois métodos de regressão logística para dados com cenários de eventos raros da área médica e financeira, buscando fazer uma comparação entre os métodos. A aplicação feita para a base médica busca compreender o impacto de fatores de risco, por exemplo, frequência cardíaca e colesterol, em doenças coronarianas. Já a aplicação feita para a base financeira, busca reconhecer transações fraudulentas com cartão de crédito por meio de variáveis explicativas resultantes de uma Análise de Componentes Principais (ACP) e outras, como por exemplo, o valor da transação e o tempo da primeira transação realizada. Os métodos de Regressão Logística usual e Regressão Logística de Firth (ou Abordagem de Firth) foram aplicados aos dois problemas e seus resultados comparados. Os dois métodos apresentaram resultados semelhantes, com uma pequena vantagem para a abordagem de Firth.
publishDate 2021
dc.date.none.fl_str_mv 2021
2022-06-20T16:00:06Z
2022-06-20T16:00:06Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, André Ribeiro Pinheiro da. Modelando a probabilidade de ocorrência de eventos raros. 2021. 77 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.
http://app.uff.br/riuff/handle/1/25275
Aluno de Graduação
identifier_str_mv SILVA, André Ribeiro Pinheiro da. Modelando a probabilidade de ocorrência de eventos raros. 2021. 77 f. Trabalho de Conclusão de Curso (Graduação de Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2021.
Aluno de Graduação
url http://app.uff.br/riuff/handle/1/25275
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Niterói
publisher.none.fl_str_mv Niterói
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823711319228416