Contributions on BI systems based on big data and predictive analytics integrated with an etl process
Autor(a) principal: | |
---|---|
Data de Publicação: | 2014 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UnB |
Texto Completo: | http://repositorio.unb.br/handle/10482/18208 |
Resumo: | Dissertação (mestrado)— Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014. |
id |
UNB_1e09198063f2bb818bafa3861ffcbff6 |
---|---|
oai_identifier_str |
oai:repositorio.unb.br:10482/18208 |
network_acronym_str |
UNB |
network_name_str |
Repositório Institucional da UnB |
repository_id_str |
|
spelling |
Contributions on BI systems based on big data and predictive analytics integrated with an etl processContribuições para um sistema de BI baseadas em big data e análise preditiva integrada em processo de ETLPrevisãoArmazenamento de dadosDissertação (mestrado)— Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014.Esta dissertação apresenta o estudo, aplicação e análise dos conceitos envolvidos num processo de Business Intelligence (BI) em três áreas principais: extração e carga de dados, análise preditiva, e armazenamento de dados usando Big Data. Primeiro, no processo de extração e carga de dados, as diferentes soluções adotadas no sistema de BI do Ministério de Planejamento, Orçamento e Gestão têm sido analisadas, e uma nova solução tem sido proposta para resolver as limitações detectadas nas soluções anteriores a cumprir com os novos requerimentos do sistema. Esses requerimentos incluem a capacidade de trabalhar com um maior volume de dados e a necessidade de um melhor monitoramento do processo de restituição ao erário nos casos em que um servidor público deve devolver o salário recebido indevidamente. Na parte de análise preditiva, diversos algoritmos de predição foram estudados e comparados usando os dados do MP. As conclusões deste estudo tem sido úteis para propor um sistema automático de detecção de fraudes e uma metodologia chamada de Extração, Transformação, Predição Adaptativa e Carga (ETAPL) que inclui predição adaptativa com seleção e configuração automática do algoritmo dentro de um processo tradicional de Extração, Transformação e Carga (ETL). Por último, as novas tecnologias de Big Data têm sido estudadas e comparadas com as atuais, de forma a avaliar a viabilidade destas tecnologias como alternativa futura no contexto do MP. _________________________________________________________________________ ABSTRACTThis dissertation presents the study, application and analysis of the concepts involved on the process of a Business Intelligence (BI) solution in three main areas: data extraction and loading, predictive analytics and storage systems using Big Data. First, in the BI data loading, the different previous solutions into the BI system of the Brazilian Ministry of Planning, Budget and Management (MP) has been analysed, and a new solution has been proposed for solving the limitations of the previous ones and for fulfilling the new requirements appeared on the project. Those requirements include the necessity of managing a bigger volume of data or the need for a better monitoring of the reimbursement process that is executed when a public servant has to refund the erroneously received money.In predictive analytics, several prediction algorithms have been analysed and compared using the data of the MP. The results has been useful for proposing an automatic fraud detection system and a new methodology called Extract, Transform, Adaptive Prediction and Load (ETAPL) that includes predictive analytics into a traditional Extract, Transform and Load (ETL) process. Finally, the new Big Data technologies have been studied and tested as future alternative for the current storage systems at the MP.Faculdade de Tecnologia (FT)Departamento de Engenharia Elétrica (FT ENE)Programa de Pós-Graduação em Engenharia ElétricaCosta, João Paulo Carvalho Lustosa daSousa Júnior, Rafael Timóteo deSerrano, Antonio Manuel Rubio2015-05-19T13:52:40Z2015-05-19T13:52:40Z2015-05-192014-06-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSERRANO, Antonio Manuel Rubio. Contributions on BI systems based on big data and predictive analytics integrated with an etl process. 2014. xi, 97 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2014.http://repositorio.unb.br/handle/10482/18208InglêsporA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2024-03-01T16:07:58Zoai:repositorio.unb.br:10482/18208Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2024-03-01T16:07:58Repositório Institucional da UnB - Universidade de Brasília (UnB)false |
dc.title.none.fl_str_mv |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process Contribuições para um sistema de BI baseadas em big data e análise preditiva integrada em processo de ETL |
title |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process |
spellingShingle |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process Serrano, Antonio Manuel Rubio Previsão Armazenamento de dados |
title_short |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process |
title_full |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process |
title_fullStr |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process |
title_full_unstemmed |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process |
title_sort |
Contributions on BI systems based on big data and predictive analytics integrated with an etl process |
author |
Serrano, Antonio Manuel Rubio |
author_facet |
Serrano, Antonio Manuel Rubio |
author_role |
author |
dc.contributor.none.fl_str_mv |
Costa, João Paulo Carvalho Lustosa da Sousa Júnior, Rafael Timóteo de |
dc.contributor.author.fl_str_mv |
Serrano, Antonio Manuel Rubio |
dc.subject.por.fl_str_mv |
Previsão Armazenamento de dados |
topic |
Previsão Armazenamento de dados |
description |
Dissertação (mestrado)— Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2014. |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014-06-30 2015-05-19T13:52:40Z 2015-05-19T13:52:40Z 2015-05-19 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SERRANO, Antonio Manuel Rubio. Contributions on BI systems based on big data and predictive analytics integrated with an etl process. 2014. xi, 97 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2014. http://repositorio.unb.br/handle/10482/18208 |
identifier_str_mv |
SERRANO, Antonio Manuel Rubio. Contributions on BI systems based on big data and predictive analytics integrated with an etl process. 2014. xi, 97 f., il. Dissertação (Mestrado em Engenharia Elétrica)—Universidade de Brasília, Brasília, 2014. |
url |
http://repositorio.unb.br/handle/10482/18208 |
dc.language.iso.fl_str_mv |
Inglês por |
language_invalid_str_mv |
Inglês |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
instname_str |
Universidade de Brasília (UnB) |
instacron_str |
UNB |
institution |
UNB |
reponame_str |
Repositório Institucional da UnB |
collection |
Repositório Institucional da UnB |
repository.name.fl_str_mv |
Repositório Institucional da UnB - Universidade de Brasília (UnB) |
repository.mail.fl_str_mv |
repositorio@unb.br |
_version_ |
1814508175991242752 |