Contributions on BI systems based on big data and predictive analytics integrated with an etl process

Detalhes bibliográficos
Autor(a) principal: Serrano, Antonio Manuel Rubio
Data de Publicação: 2014
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio.unb.br/handle/10482/18208
Resumo: Dissertação (mestrado)— Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014.
id UNB_1e09198063f2bb818bafa3861ffcbff6
oai_identifier_str oai:repositorio.unb.br:10482/18208
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Contributions on BI systems based on big data and predictive analytics integrated with an etl processContribuições para um sistema de BI baseadas em big data e análise preditiva integrada em processo de ETLPrevisãoArmazenamento de dadosDissertação (mestrado)— Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014.Esta dissertação apresenta o estudo, aplicação e análise dos conceitos envolvidos num processo de Business Intelligence (BI) em três áreas principais: extração e carga de dados, análise preditiva, e armazenamento de dados usando Big Data. Primeiro, no processo de extração e carga de dados, as diferentes soluções adotadas no sistema de BI do Ministério de Planejamento, Orçamento e Gestão têm sido analisadas, e uma nova solução tem sido proposta para resolver as limitações detectadas nas soluções anteriores a cumprir com os novos requerimentos do sistema. Esses requerimentos incluem a capacidade de trabalhar com um maior volume de dados e a necessidade de um melhor monitoramento do processo de restituição ao erário nos casos em que um servidor público deve devolver o salário recebido indevidamente. Na parte de análise preditiva, diversos algoritmos de predição foram estudados e comparados usando os dados do MP. As conclusões deste estudo tem sido úteis para propor um sistema automático de detecção de fraudes e uma metodologia chamada de Extração, Transformação, Predição Adaptativa e Carga (ETAPL) que inclui predição adaptativa com seleção e configuração automática do algoritmo dentro de um processo tradicional de Extração, Transformação e Carga (ETL). Por último, as novas tecnologias de Big Data têm sido estudadas e comparadas com as atuais, de forma a avaliar a viabilidade destas tecnologias como alternativa futura no contexto do MP. _________________________________________________________________________ ABSTRACTThis dissertation presents the study, application and analysis of the concepts involved on the process of a Business Intelligence (BI) solution in three main areas: data extraction and loading, predictive analytics and storage systems using Big Data. First, in the BI data loading, the different previous solutions into the BI system of the Brazilian Ministry of Planning, Budget and Management (MP) has been analysed, and a new solution has been proposed for solving the limitations of the previous ones and for fulfilling the new requirements appeared on the project. Those requirements include the necessity of managing a bigger volume of data or the need for a better monitoring of the reimbursement process that is executed when a public servant has to refund the erroneously received money.In predictive analytics, several prediction algorithms have been analysed and compared using the data of the MP. The results has been useful for proposing an automatic fraud detection system and a new methodology called Extract, Transform, Adaptive Prediction and Load (ETAPL) that includes predictive analytics into a traditional Extract, Transform and Load (ETL) process. Finally, the new Big Data technologies have been studied and tested as future alternative for the current storage systems at the MP.Faculdade de Tecnologia (FT)Departamento de Engenharia Elétrica (FT ENE)Programa de Pós-Graduação em Engenharia ElétricaCosta, João Paulo Carvalho Lustosa daSousa Júnior, Rafael Timóteo deSerrano, Antonio Manuel Rubio2015-05-19T13:52:40Z2015-05-19T13:52:40Z2015-05-192014-06-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSERRANO, Antonio Manuel Rubio. Contributions on BI systems based on big data and predictive analytics integrated with an etl process. 2014. xi, 97 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2014.http://repositorio.unb.br/handle/10482/18208InglêsporA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-01T16:07:58Zoai:repositorio.unb.br:10482/18208Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-01T16:07:58Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Contributions on BI systems based on big data and predictive analytics integrated with an etl process
Contribuições para um sistema de BI baseadas em big data e análise preditiva integrada em processo de ETL
title Contributions on BI systems based on big data and predictive analytics integrated with an etl process
spellingShingle Contributions on BI systems based on big data and predictive analytics integrated with an etl process
Serrano, Antonio Manuel Rubio
Previsão
Armazenamento de dados
title_short Contributions on BI systems based on big data and predictive analytics integrated with an etl process
title_full Contributions on BI systems based on big data and predictive analytics integrated with an etl process
title_fullStr Contributions on BI systems based on big data and predictive analytics integrated with an etl process
title_full_unstemmed Contributions on BI systems based on big data and predictive analytics integrated with an etl process
title_sort Contributions on BI systems based on big data and predictive analytics integrated with an etl process
author Serrano, Antonio Manuel Rubio
author_facet Serrano, Antonio Manuel Rubio
author_role author
dc.contributor.none.fl_str_mv Costa, João Paulo Carvalho Lustosa da
Sousa Júnior, Rafael Timóteo de
dc.contributor.author.fl_str_mv Serrano, Antonio Manuel Rubio
dc.subject.por.fl_str_mv Previsão
Armazenamento de dados
topic Previsão
Armazenamento de dados
description Dissertação (mestrado)— Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014.
publishDate 2014
dc.date.none.fl_str_mv 2014-06-30
2015-05-19T13:52:40Z
2015-05-19T13:52:40Z
2015-05-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SERRANO, Antonio Manuel Rubio. Contributions on BI systems based on big data and predictive analytics integrated with an etl process. 2014. xi, 97 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2014.
http://repositorio.unb.br/handle/10482/18208
identifier_str_mv SERRANO, Antonio Manuel Rubio. Contributions on BI systems based on big data and predictive analytics integrated with an etl process. 2014. xi, 97 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2014.
url http://repositorio.unb.br/handle/10482/18208
dc.language.iso.fl_str_mv Inglês
por
language_invalid_str_mv Inglês
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1814508175991242752