Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores

Detalhes bibliográficos
Autor(a) principal: Souza, Rafael Alexandrino Spíndola de
Data de Publicação: 2021
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/123456789/21205
Resumo: With increasing amounts of data to be analyzed and correctly interpreted, Anomaly Detection (or Outliers) appears as one of the areas of significant impact in the context of Data Mining (DM). Its applications extend to the most diverse human activity fields, such as medicine, administration, process management, information science, physics, economics, and many other activities. In this work, we propose a non-parametric system to support the detection of aberrant events in stationary databases. The database comes from the Public Administration and related to the Federal Government’s Disbursement and Bidding Data between 2014 and 2019, to the Fund’s Budget Data Municipal Health of João Pessoa - PB, between 2016 and 2020, and Data on the Fleet Management of the State of Paraíba between 2017 and 2019. The proposed solution combines some supervised and unsupervised detection algorithms (OCSVM, LOF, CBLOF, HBOS, KNN, Isolation Forest, and Robust Covariance) to classify events as anomalies. The results showed that the solution identifies an average of 90.07% correctly events as outliers. Therefore, there are indications that the proposed solution can contribute to government audit support activities and management and decision-making processes, these arising from the interpretation of the phenomena present in the data.
id UFPB_83b176fab66da353b8599355f22743fa
oai_identifier_str oai:repositorio.ufpb.br:123456789/21205
network_acronym_str UFPB
network_name_str Biblioteca Digital de Teses e Dissertações da UFPB
repository_id_str
spelling Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadoresDetecção de anomaliasDetecção de outliersAprendizagem supervisionadaAprendizagem não supervisionadaMineração de dadosDados governamentaisAnomaly detectionOutlier detectionSupervised learningUnsupervised learningData miningGovernment dataCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOWith increasing amounts of data to be analyzed and correctly interpreted, Anomaly Detection (or Outliers) appears as one of the areas of significant impact in the context of Data Mining (DM). Its applications extend to the most diverse human activity fields, such as medicine, administration, process management, information science, physics, economics, and many other activities. In this work, we propose a non-parametric system to support the detection of aberrant events in stationary databases. The database comes from the Public Administration and related to the Federal Government’s Disbursement and Bidding Data between 2014 and 2019, to the Fund’s Budget Data Municipal Health of João Pessoa - PB, between 2016 and 2020, and Data on the Fleet Management of the State of Paraíba between 2017 and 2019. The proposed solution combines some supervised and unsupervised detection algorithms (OCSVM, LOF, CBLOF, HBOS, KNN, Isolation Forest, and Robust Covariance) to classify events as anomalies. The results showed that the solution identifies an average of 90.07% correctly events as outliers. Therefore, there are indications that the proposed solution can contribute to government audit support activities and management and decision-making processes, these arising from the interpretation of the phenomena present in the data.NenhumaCom quantidades cada vez maiores de dados para serem analisados e corretamente interpretados, a Detecção de Anomalias (ou Outliers) surge como uma das áreas de grande impacto no contexto da Mineração de Dados (MD). Suas aplicações estendem-se aos mais diversos campos da atuação humana, notadamente na medicina, administração, gestão de processos, ciência da informação, física, economia e em muitas outras atividades. Neste trabalho, propõe-se um Sistema não paramétrico de apoio à detecção de eventos aberrantes em bases de dados estacionárias, provenientes da Administração Pública e relacionadas aos Dados de Dispensas e Inexigibilidades de Licitações do Governo Federal entre 2014 e 2019, aos Dados Orçamentários do Fundo Municipal de Saúde de João Pessoa – PB, entre 2016 e 2020, e aos Dados relativos ao Gerenciamento de Frotas do Estado da Paraíba, entre 2017 e 2019. A solução proposta reúne múltiplos algoritmos de detecção supervisionada e não supervisionada (OCSVM, LOF, CBLOF, HBOS, KNN, Isolation Forest e Robust Covariance) para classificar os eventos como anomalias. Os resultados mostraram que, do total de eventos retornados pela solução, em média, 90,07% deles foram corretamente identificados como outliers. Portanto, há indicativos de que a solução proposta tem potencial de contribuir para as atividades de apoio a auditoria governamental, bem como para os processos de gerenciamento e tomada de decisão, estes decorrentes da interpretação dos fenômenos presentes nos dados.Universidade Federal da ParaíbaBrasilInformáticaPrograma de Pós-Graduação em InformáticaUFPBAraújo, Tiago Maritan Ugulino dehttp://lattes.cnpq.br/6347743344931103Souza, Rafael Alexandrino Spíndola de2021-10-13T14:18:19Z2021-05-052021-10-13T14:18:19Z2021-04-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://repositorio.ufpb.br/jspui/handle/123456789/21205porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2022-08-09T17:32:51Zoai:repositorio.ufpb.br:123456789/21205Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| diretoria@ufpb.bropendoar:2022-08-09T17:32:51Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.none.fl_str_mv Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
title Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
spellingShingle Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
Souza, Rafael Alexandrino Spíndola de
Detecção de anomalias
Detecção de outliers
Aprendizagem supervisionada
Aprendizagem não supervisionada
Mineração de dados
Dados governamentais
Anomaly detection
Outlier detection
Supervised learning
Unsupervised learning
Data mining
Government data
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
title_full Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
title_fullStr Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
title_full_unstemmed Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
title_sort Um sistema de apoio à detecção de anomalias em dados governamentais usando múltiplos classificadores
author Souza, Rafael Alexandrino Spíndola de
author_facet Souza, Rafael Alexandrino Spíndola de
author_role author
dc.contributor.none.fl_str_mv Araújo, Tiago Maritan Ugulino de
http://lattes.cnpq.br/6347743344931103
dc.contributor.author.fl_str_mv Souza, Rafael Alexandrino Spíndola de
dc.subject.por.fl_str_mv Detecção de anomalias
Detecção de outliers
Aprendizagem supervisionada
Aprendizagem não supervisionada
Mineração de dados
Dados governamentais
Anomaly detection
Outlier detection
Supervised learning
Unsupervised learning
Data mining
Government data
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Detecção de anomalias
Detecção de outliers
Aprendizagem supervisionada
Aprendizagem não supervisionada
Mineração de dados
Dados governamentais
Anomaly detection
Outlier detection
Supervised learning
Unsupervised learning
Data mining
Government data
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description With increasing amounts of data to be analyzed and correctly interpreted, Anomaly Detection (or Outliers) appears as one of the areas of significant impact in the context of Data Mining (DM). Its applications extend to the most diverse human activity fields, such as medicine, administration, process management, information science, physics, economics, and many other activities. In this work, we propose a non-parametric system to support the detection of aberrant events in stationary databases. The database comes from the Public Administration and related to the Federal Government’s Disbursement and Bidding Data between 2014 and 2019, to the Fund’s Budget Data Municipal Health of João Pessoa - PB, between 2016 and 2020, and Data on the Fleet Management of the State of Paraíba between 2017 and 2019. The proposed solution combines some supervised and unsupervised detection algorithms (OCSVM, LOF, CBLOF, HBOS, KNN, Isolation Forest, and Robust Covariance) to classify events as anomalies. The results showed that the solution identifies an average of 90.07% correctly events as outliers. Therefore, there are indications that the proposed solution can contribute to government audit support activities and management and decision-making processes, these arising from the interpretation of the phenomena present in the data.
publishDate 2021
dc.date.none.fl_str_mv 2021-10-13T14:18:19Z
2021-05-05
2021-10-13T14:18:19Z
2021-04-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/21205
url https://repositorio.ufpb.br/jspui/handle/123456789/21205
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Informática
UFPB
publisher.none.fl_str_mv Universidade Federal da Paraíba
Brasil
Informática
Programa de Pós-Graduação em Informática
UFPB
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Biblioteca Digital de Teses e Dissertações da UFPB
collection Biblioteca Digital de Teses e Dissertações da UFPB
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br|| diretoria@ufpb.br
_version_ 1801842983280050176