Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados

Amorim, Fernanda Santos

Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados

Detalhes bibliográficos
Autor(a) principal:	Amorim, Fernanda Santos
Data de Publicação:	2021
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UnB
Texto Completo:	https://repositorio.unb.br/handle/10482/42727
Resumo:	Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Programa de Pós-Graduação em Administração, 2021.

Metadados do item

id	UNB_e909f456b2109deebcc69224aacea36a
oai_identifier_str	oai:repositorio.unb.br:10482/42727
network_acronym_str	UNB
network_name_str	Repositório Institucional da UnB
repository_id_str
spelling	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dadosFraudesDados desbalanceadosAprendizagem de máquinaDissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Programa de Pós-Graduação em Administração, 2021.Fraudes Financeiras têm se tornado alvo de diversos estudos, devido aos impactos (principalmente econômicos), que estas podem causar a empresas, países e pessoas físicas. Detecção de Fraudes é a área de estudos que procura identificar atividades fraudulentas. Estas análises são feitas dentro de conjuntos de dados que são muito desbalanceados devido à baixa ocorrência dos acontecimentos alvo, isto é, existem classes de dados que ocorrem com maior frequência (classes majoritárias) que outras(classes minoritárias). Os dados que ocorrem com menor frequência são conhecidos como eventos raros e podem ser observados em diversas áreas de estudo como medicina (doenças raras), sistemas de rede (detecção de intrusos), meteorologia (desastres naturais), finanças (fraudes, falência). O estudo proposto tem como objetivo avaliar o desempenho de Modelos Supervisionados de Aprendizado de Máquina para dados desbalanceados de Indício de Fraudes em Fundos de Pensão utilizado Técnicas de Balanceamento de dados. Os dados utilizados foram cedidos pela Superintendência Nacional de Previdência Complementar (PREVIC). Para Seleção de Variáveis, foi usado Análise de Componentes Principais. Os modelos utilizados foram: Regressão Logística, Random Forest, Máquina de Suporte Vetorial e Redes Neurais. As Técnicas de Balanceamento utilizadas foram Random Undersampling, SMOTE e SMOTETomek.Com os testes realizados, este estudo recomenda a utilização do Random Forest como Modelo de Aprendizado de Máquina, ajustando o desbalanceamento da base com o SMOTE, por ter apresentado os melhores resultados de acordo com as Métricas de Avaliação utilizadasFinancial frauds has become the target of several studies, due to its impacts (whichare mainly economical) that can cause to companies, countries and individuals. Fraud Detection is the field of study that seeks to identify fraudulent activities. These analyzes are made within datasets that are very unbalanced due to the low occurrence ofthe target events, that is, there are data classes that occur more frequently (majorityclasses) than others (minority classes). The data that occur less frequently are knownas rare events and can be seen in several fields of studies such as medicine (rarediseases), network systems (intrusion detection), meteorology (natural disasters), and finance (fraud, bankruptcy). The proposed study aims to evaluate the performanceof Supervised Machine Learning Models for unbalanced data of Fraud Indication inPension Funds using Data Balancing Techniques. The data used were provided by the National Superintendency of Complementary Pension (PREVIC). For Variable Selection, Principal Component Analysis was used. The models used were: Logistic Regression, Random Forest, Vector Support Machine and Neural Networks. The Bal-ancing Techniques used were Random Undersampling, SMOTE and SMOTETomek.With the tests performed, this study recommends the use ofRandom Forestas a Ma-chine Learning Model, adjusting the base unbalance with SMOTE, as it presented thebest results according to the Evaluation Metrics used.Albuquerque, Pedro Henrique MeloAmorim, Fernanda Santos2022-01-11T21:20:51Z2022-01-11T21:20:51Z2022-01-112021-10-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfAMORIM, Fernanda Santos. Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados. 2021. 95 f., il. Dissertação (Mestrado em Administração)—Universidade de Brasília, Brasília, 2021.https://repositorio.unb.br/handle/10482/42727A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2023-07-12T19:07:38Zoai:repositorio.unb.br:10482/42727Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2023-07-12T19:07:38Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados
title	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados
spellingShingle	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados Amorim, Fernanda Santos Fraudes Dados desbalanceados Aprendizagem de máquina
title_short	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados
title_full	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados
title_fullStr	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados
title_full_unstemmed	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados
title_sort	Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados
author	Amorim, Fernanda Santos
author_facet	Amorim, Fernanda Santos
author_role	author
dc.contributor.none.fl_str_mv	Albuquerque, Pedro Henrique Melo
dc.contributor.author.fl_str_mv	Amorim, Fernanda Santos
dc.subject.por.fl_str_mv	Fraudes Dados desbalanceados Aprendizagem de máquina
topic	Fraudes Dados desbalanceados Aprendizagem de máquina
description	Dissertação (mestrado)—Universidade de Brasília, Faculdade de Economia, Administração e Contabilidade, Programa de Pós-Graduação em Administração, 2021.
publishDate	2021
dc.date.none.fl_str_mv	2021-10-29 2022-01-11T21:20:51Z 2022-01-11T21:20:51Z 2022-01-11
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	AMORIM, Fernanda Santos. Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados. 2021. 95 f., il. Dissertação (Mestrado em Administração)—Universidade de Brasília, Brasília, 2021. https://repositorio.unb.br/handle/10482/42727
identifier_str_mv	AMORIM, Fernanda Santos. Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados. 2021. 95 f., il. Dissertação (Mestrado em Administração)—Universidade de Brasília, Brasília, 2021.
url	https://repositorio.unb.br/handle/10482/42727
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB
instname_str	Universidade de Brasília (UnB)
instacron_str	UNB
institution	UNB
reponame_str	Repositório Institucional da UnB
collection	Repositório Institucional da UnB
repository.name.fl_str_mv	Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv	repositorio@unb.br
_version_	1810580804426792960

Previsão de indícios de fraude em fundos de pensão utilizando modelos de aprendizado de máquina supervisionados e técnicas de balanceamento de dados

Registros relacionados