Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems

Detalhes bibliográficos
Autor(a) principal: Pilon, Bruno Hernandes Azenha
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/18956
http://dx.doi.org/10.26512/2015.04.D.18956
Resumo: Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2015.
id UNB_a8d6510aedc79d0fab17bcdc993fb506
oai_identifier_str oai:repositorio.unb.br:10482/18956
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systemsAnálise preditiva via processos gaussianos e auditoria estatística via Misturas Gaussianas em sistemas de inteligência de negóciosInteligência de negóciosProcessos gaussianosMisturas GaussianasDissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2015.Um sistema de Inteligência de Negócios, do inglês \emph{Business Intelligence} (BI), é um sistema de informação que emprega ferramentas de diversas áreas do conhecimento na coleta, integração e análise de dados para aprimorar e embasar o processo decisório em empresas e instituições governamentais. O Ministério do Planejamento, Orçamento e Gestão (MP), órgão do governo federal brasileiro, possui uma série de sistemas de inteligência de negócios e, neste trabalho, dois destes sistemas foram considerados. O primeiro sistema de BI, mantido pela Secretaria de Patrimônio da União (SPU), contém dados de arrecadação mensal de impostos daquela Secretaria, enquanto o segundo sistema de BI, mantido pela Coordenadoria de Inteligência e Auditoria Preventiva da Folha de Pagamento (CGAUD), contém dados da folha de pagamento dos servidores públicos federais brasileiros. Ambos os sistemas foram construídos objetivando-se a detecção de fraudes e irregularidades como evasão fiscal e pagamentos não autorizados. Ao longo deste trabalho, pretende-se incorporar estágios que adicionem análise preditiva e melhorias de performance aos sistemas de BI existentes. No sistema de BI da SPU, Regressão por Processos Gaussianos (RPG) é utilizada para modelar as características intrínsecas da principal série temporal financeira. RPG retorna uma descrição estatística completa da variável estimada, que pode ser tratada como uma medida de confiança e pode ser utilizada como gatilho para classificar dados em confiáveis ou não confiáveis. Ademais, um estágio de pré-processamento reconfigura a série temporal original em uma estrutura bidimensional. O algoritmo resultante, com RPG em seu núcleo, superou métodos preditivos clássicos como indicadores financeiros e redes neurais artificiais. No sistema de BI da CGAUD, um Modelo de Misturas Gaussianas (MMG) é utilizado para descrever o processo estocástico que governa a distribuição de probabilidades dos contracheques. Rotular uma probabilidade relativa em cada contracheque habilita o sistema de BI a listá-los e filtrá-los com base em suas probabilidades. A inserção de um filtro estatístico em um sistema de BI determinístico resultou em efetiva redução na quantidade de dados a serem analisados pelas trilhas de auditoria.A Business Intelligence (BI) system is an information system that employs tools from several areas of knowledge for the collection, integration and analysis of data to improve and support the decision making process in companies and governmental institutions. The Ministry of Planning, Budget and Management, in portuguese Ministério do Planejamento, Orçamento e Gestão (MP), an agency of the Brazilian federal government, possesses a wide number of BI systems and, in this work, two of those systems were considered. The first BI system, maintained by the Federal Patrimony Department, in portuguese Secretaria de Patrimônio da União (SPU), contains data regarding the monthly tax collection of that department, whereas the second BI system, maintained by the Human Resources Auditing Department, in portuguese Coordenadoria de Inteligência e Auditoria Preventiva da Folha de Pagamentos (CGAUD), contains data regarding the payroll of Brazilian federal employees. Both systems were designed aimed at fraud and irregularities detection such as tax evasion and unauthorized payments. Throughout the present work, we aim to incorporate stages into the existing BI systems in order to add predictive analytics and performance enhancements. In the BI system of SPU, Gaussian Process for Regression (GPR) is used to model the intrinsic characteristics of the core financial time series. GPR natively returns a full statistical description of the estimated variable, which can be treated as a measure of confidence and can be used as a trigger to classify trusted and untrusted data. In order to take into account the multidimensional structure of the original data, we also propose a pre-processing stage for reshaping the original time series into a bidimensional structure. The resulting algorithm, with GPR at its core, outperforms classical predictive schemes such as financial indicators and artificial neural networks. In the BI system of CGAUD, a Gaussian Mixture Model (GMM) is used to describe the stochastic process that governs the probability distribution of payrolls. Attaching a relative probability into each payroll enables the BI system to sort and filter payrolls based on their probabilities. Inserting a statistical filter in a deterministic BI system showed to be effective in reducing the amount of data to be analyzed by rule-based audit trails.Faculdade de Tecnologia (FT)Departamento de Engenharia Elétrica (FT ENE)Programa de Pós-Graduação em Engenharia ElétricaCosta, João Paulo Carvalho Lustosa daMurillo-Fuentes, Juan JoséPilon, Bruno Hernandes Azenha2015-12-17T20:18:13Z2015-12-17T20:18:13Z2015-12-172015-04-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPILON, Bruno Hernandes Azenha. Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems. 2015. xvi, 69 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2015.http://repositorio.unb.br/handle/10482/18956http://dx.doi.org/10.26512/2015.04.D.18956InglêsporA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-01T16:07:56Zoai:repositorio.unb.br:10482/18956Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-01T16:07:56Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
Análise preditiva via processos gaussianos e auditoria estatística via Misturas Gaussianas em sistemas de inteligência de negócios
title Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
spellingShingle Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
Pilon, Bruno Hernandes Azenha
Inteligência de negócios
Processos gaussianos
Misturas Gaussianas
title_short Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
title_full Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
title_fullStr Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
title_full_unstemmed Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
title_sort Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems
author Pilon, Bruno Hernandes Azenha
author_facet Pilon, Bruno Hernandes Azenha
author_role author
dc.contributor.none.fl_str_mv Costa, João Paulo Carvalho Lustosa da
Murillo-Fuentes, Juan José
dc.contributor.author.fl_str_mv Pilon, Bruno Hernandes Azenha
dc.subject.por.fl_str_mv Inteligência de negócios
Processos gaussianos
Misturas Gaussianas
topic Inteligência de negócios
Processos gaussianos
Misturas Gaussianas
description Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2015.
publishDate 2015
dc.date.none.fl_str_mv 2015-12-17T20:18:13Z
2015-12-17T20:18:13Z
2015-12-17
2015-04-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PILON, Bruno Hernandes Azenha. Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems. 2015. xvi, 69 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2015.
http://repositorio.unb.br/handle/10482/18956
http://dx.doi.org/10.26512/2015.04.D.18956
identifier_str_mv PILON, Bruno Hernandes Azenha. Predictive analytics via gaussian processes and statistical audit via gaussian mixtures in business intelligence systems. 2015. xvi, 69 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2015.
url http://repositorio.unb.br/handle/10482/18956
http://dx.doi.org/10.26512/2015.04.D.18956
dc.language.iso.fl_str_mv Inglês
por
language_invalid_str_mv Inglês
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508174115340288