Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão

Detalhes bibliográficos
Autor(a) principal: Pires, Carlos Eduardo Machado
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UnB
Texto Completo: http://repositorio2.unb.br/jspui/handle/10482/47817
Resumo: Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação Profissional em Computação Aplicada, 2019.
id UNB_f9a10f7c6510999b7872f0cf00ef950b
oai_identifier_str oai:repositorio2.unb.br:10482/47817
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Pires, Carlos Eduardo MachadoLadeira, MarceloSilva, João Mello da2024-02-21T10:43:27Z2024-02-21T10:43:27Z2024-02-212019-07-31PIRES, Carlos Eduardo Machado. Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão. 2019. xiv, 78 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2019.http://repositorio2.unb.br/jspui/handle/10482/47817Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação Profissional em Computação Aplicada, 2019.Segundo o Sistema Nacional de Informação sobre Saneamento - SNIS, em 2016 a perda de faturamento da Companhia de Saneamento Ambiental do Distrito Federal, Caesb, foi de 24,71% decorrentes das perdas de água. As perdas de água são, majoritariamente, combatidas por ações de engenharia para detecção e correção de vazamentos nas redes, as chamadas perdas reais. No entanto, as perdas denominadas aparentes (aquelas em que a água produzida é consumida mas não faturada) são de difícil detecção, de modo que seu combate é realizado por investigações em campo após denúncias de fraudes ou seleção aleatória ou pouco sistematizada dos locais a serem investigados. Neste contexto, a mineração de dados se mostra ferramenta fundamental na identificação de riscos ao faturamento possibilitando otimizar as investigações in loco e descoberta de possibilidades de ampliação de receita. Esta pesquisa apresenta o estudo de caso da Caesb, onde duas abordagens foram adotadas visando identificar, por meio da mineração de dados, os potenciais riscos ao faturamento da companhia. A primeira abordagem focou na criação de um modelo preditivo para identificação de potenciais fraudes no consumo de água, onde duas hipóteses foram elaboradas, testadas e refutadas por problemas de consistência nos dados. A segunda abordagem pautou-se no conceito de par perfeito. Este conceito parte da premissa que o cliente deve gerar receita para Caesb pelos serviços de abastecimento de água e coleta de esgoto. Com este pressuposto, foi elaborada, testada e confirmada a hipótese de que clientes localizados em regiões em que existem redes de abastecimento de água e/ou esgotamento sanitário mas que não pagam por quaisquer destes serviços resultam em potencial risco ao faturamento da companhia. Neste sentido, o modelo de mineração de dados criado combina dados comerciais e geoespaciais para descoberta dos clientes que violam o conceito de par perfeito e, por meio de análise geoespacial, realiza a clusterização destes clientes em quatro grupos distintos: inconsistência cadastral, problema operacional, problema de expansão e problema de extensão. O modelo de mineração de dados é executado mensalmente, de forma automática, a cada fechamento comercial e o resultado da mineração apresentado em um dashboard web que possibilita identifica a quantidade, localidade e categoria dos imóveis que violam o par perfeito, bem como estimar o impacto financeiro causado. Em maio de 2019, o modelo detectou 119.887 potenciais situações que geram impacto financeiro, entre perda de faturamento e oportunidade de aumento de receita, na ordem de R$ 120 Milhões/ano, ou seja, 7,5% do faturamento anual da empresa.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES).According to the National Sanitation Information System - SNIS, in 2016 the loss of revenues of the Environmental Sanitation Company of the Federal District, Caesb, was 24.71% due to water losses. Water losses are mostly countered by engineering actions to detect and correct leaks in the networks, the so-called real losses. However, the so-called apparent losses (those in which the produced water is consumed but not billed) are difficult to detect, so that their combat is carried out by field investigations after allegations of fraud or random or poorly selected sites to be investigated. In this context, data mining proves to be a fundamental tool in identifying billing risks, enabling the optimization of on-site investigations and the discovery of revenue expansion possibilities. This research presents Caesb’s case study, where two approaches were adopted to identify, through data mining, the potential risks to the company’s revenue. The first approach focused on the creation of a predictive model for identifying potential water consumption frauds, where two hypotheses were elaborated, tested and refuted by data consistency problems. The second approach was based on the concept of perfect match. This concept assumes that the client must generate revenue for Caesb for water supply and sewage collection services. Based on this assumption, it was developed, tested and confirmed that customers located in regions where there are water supply and/or sewage systems but who do not pay for any of these services result in a potential risk to the company’s revenues. In this sense, the data mining model created combines business and geospatial data to discover clients that violate the perfect pair concept and, through geospatial analysis, cluster these clients into four distinct groups (cadastral inconsistency, operational problem, expansion problem and extension problem). The data mining model is automatically executed monthly at each trade close and the mining result presented in a web dashboard that identifies the number, location and category of properties that violate the perfect match, as well as estimating the impact caused. In May 2019, the model detected, 119,887 potential situations that generate financial impact were detected, such as loss of revenue and opportunity to increase revenue, in the order of R$ 120 million / year, or 7.5% of the annual revenue of the Company.Instituto de Ciências Exatas (IE)Departamento de Ciência da Computação (IE CIC)Programa de Pós-Graduação em Computação Aplicada, Mestrado ProfissionalporGeoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPerdas financeirasCompanhia de Saneamento Ambiental do Distrito Federal (Caesb/DF)Mineração de dadosGeoprocessamentoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNBORIGINAL2019_CarlosEduardoMachadoPires.pdf2019_CarlosEduardoMachadoPires.pdfapplication/pdf16060230http://repositorio2.unb.br/jspui/bitstream/10482/47817/1/2019_CarlosEduardoMachadoPires.pdf2eebd922d089bc9428d1c0ceca688fe0MD51open accessLICENSElicense.txtlicense.txttext/plain102http://repositorio2.unb.br/jspui/bitstream/10482/47817/2/license.txtaed4704d04bb260d4decd80db311aaa5MD52open access10482/478172024-02-26 17:22:57.986open accessoai:repositorio2.unb.br:10482/47817U3VibWlzc8OjbyBlZmV0aXZhZGEgZGUgYWNvcmRvIGNvbSBsaWNlbsOnYSBjb25jZWRpZGEgcGVsbyBhdXRvciBlL291IGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcy4KBiblioteca Digital de Teses e DissertaçõesPUBhttps://repositorio.unb.br/oai/requestopendoar:2024-02-26T20:22:57Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
title Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
spellingShingle Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
Pires, Carlos Eduardo Machado
Perdas financeiras
Companhia de Saneamento Ambiental do Distrito Federal (Caesb/DF)
Mineração de dados
Geoprocessamento
title_short Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
title_full Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
title_fullStr Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
title_full_unstemmed Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
title_sort Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão
author Pires, Carlos Eduardo Machado
author_facet Pires, Carlos Eduardo Machado
author_role author
dc.contributor.advisorco.none.fl_str_mv Ladeira, Marcelo
dc.contributor.author.fl_str_mv Pires, Carlos Eduardo Machado
dc.contributor.advisor1.fl_str_mv Silva, João Mello da
contributor_str_mv Silva, João Mello da
dc.subject.keyword.pt_BR.fl_str_mv Perdas financeiras
Companhia de Saneamento Ambiental do Distrito Federal (Caesb/DF)
Mineração de dados
Geoprocessamento
topic Perdas financeiras
Companhia de Saneamento Ambiental do Distrito Federal (Caesb/DF)
Mineração de dados
Geoprocessamento
description Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graduação Profissional em Computação Aplicada, 2019.
publishDate 2019
dc.date.submitted.none.fl_str_mv 2019-07-31
dc.date.accessioned.fl_str_mv 2024-02-21T10:43:27Z
dc.date.available.fl_str_mv 2024-02-21T10:43:27Z
dc.date.issued.fl_str_mv 2024-02-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PIRES, Carlos Eduardo Machado. Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão. 2019. xiv, 78 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2019.
dc.identifier.uri.fl_str_mv http://repositorio2.unb.br/jspui/handle/10482/47817
identifier_str_mv PIRES, Carlos Eduardo Machado. Geoprocessamento e mineração de dados na identificação de riscos e ganhos no faturamento e no suporte a decisão de expansão. 2019. xiv, 78 f., il. Dissertação (Mestrado Profissional em Computação Aplicada) — Universidade de Brasília, Brasília, 2019.
url http://repositorio2.unb.br/jspui/handle/10482/47817
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
bitstream.url.fl_str_mv http://repositorio2.unb.br/jspui/bitstream/10482/47817/1/2019_CarlosEduardoMachadoPires.pdf
http://repositorio2.unb.br/jspui/bitstream/10482/47817/2/license.txt
bitstream.checksum.fl_str_mv 2eebd922d089bc9428d1c0ceca688fe0
aed4704d04bb260d4decd80db311aaa5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv
_version_ 1801864036579540992