MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) |
Texto Completo: | http://tede2.pucgoias.edu.br:8080/handle/tede/3892 |
Resumo: | Com o aumento exponencial do volume de dados armazenados e o alto potencial de conhecimento oculto nesses dados que pode auxiliar nas estratégias e nas tomadas de decisão das organizações, muito vem se investido em tecnologia da informação e telecomunicação. A presente dissertação teve como objetivo aplicar o processo de Descoberta do Conhecimento em Base de Dados (DCBD) a fim de classificar os contribuintes de ICMS da SEFAZ-GO em Alto Sonegador e Baixo Sonegador, por meio da tarefa de mineração de dados Classificação Supervisionada, implementada pelo algoritmo J48, na plataforma computacional WEKA. Foram realizados 3 experimentos com uma amostra de dados de contribuintes de ICMS do setor atacadista do município de Goiânia-GO, com atributos selecionados a partir do Código do Tributário do Estado de Goiás. Durante os experimentos foram aplicados os algoritmos AttributeSelection e Discretize, para a redução de atributos e transformação das variáveis contínuas em discretas, respectivamente. Os índices estatísticos Matriz de Confusão e Coeficiente de Kappa foram utilizados como métricas de validação do modelo proposto. Após cada experimento, regras de classificação foram extraídas formando assim o modelo preditivo proposto de classificação. Obteve-se, no melhor cenário, uma taxa de classificação correta de 84% de acerto. A mineração de dados é uma realidade dentro de muitas organizações e pode ser uma forte aliada no cumprimento da, nada trivial, tarefa de descoberta de conhecimento nas bases de dados corporativas. |
id |
PUC_GO_e6a602602c92705c4cc39030cee8de67 |
---|---|
oai_identifier_str |
oai:ambar:tede/3892 |
network_acronym_str |
PUC_GO |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) |
repository_id_str |
6593 |
spelling |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GOSonegação Fiscal, Árvore de Decisão, DCBD, WEKATax evasion, Decision tree, KDD, WEKAENGENHARIAS::ENGENHARIA DE PRODUCAOCom o aumento exponencial do volume de dados armazenados e o alto potencial de conhecimento oculto nesses dados que pode auxiliar nas estratégias e nas tomadas de decisão das organizações, muito vem se investido em tecnologia da informação e telecomunicação. A presente dissertação teve como objetivo aplicar o processo de Descoberta do Conhecimento em Base de Dados (DCBD) a fim de classificar os contribuintes de ICMS da SEFAZ-GO em Alto Sonegador e Baixo Sonegador, por meio da tarefa de mineração de dados Classificação Supervisionada, implementada pelo algoritmo J48, na plataforma computacional WEKA. Foram realizados 3 experimentos com uma amostra de dados de contribuintes de ICMS do setor atacadista do município de Goiânia-GO, com atributos selecionados a partir do Código do Tributário do Estado de Goiás. Durante os experimentos foram aplicados os algoritmos AttributeSelection e Discretize, para a redução de atributos e transformação das variáveis contínuas em discretas, respectivamente. Os índices estatísticos Matriz de Confusão e Coeficiente de Kappa foram utilizados como métricas de validação do modelo proposto. Após cada experimento, regras de classificação foram extraídas formando assim o modelo preditivo proposto de classificação. Obteve-se, no melhor cenário, uma taxa de classificação correta de 84% de acerto. A mineração de dados é uma realidade dentro de muitas organizações e pode ser uma forte aliada no cumprimento da, nada trivial, tarefa de descoberta de conhecimento nas bases de dados corporativas.With the exponential increase in the volume of data stored and the high potential for hidden knowledge in these data that can aid in the strategies and decision making of organizations, much has been invested in information technology and telecommunication. The purpose of this dissertation was to apply the Knowledge Discovery in Database (DCBD) process in order to classify the taxpayers of SEFAZ-GO ICMS in High Eviction and Low Eviction, through the task of data mining Supervised Classification, Implemented by the algorithm J48, on the WEKA computing platform. Three experiments were carried out with a sample of ICMS taxpayers data from the wholesale sector of the city of Goiânia-GO, with attributes selected from the Tax Code of the State of Goiás. During the experiments, the AttributeSelection and Discretize algorithms were applied. Reduction of attributes and transformation of the continuous variables into discrete ones, respectively. The statistical indices Confusion Matrix and Kappa Coefficient were used as validation metrics of the proposed model. After each experiment, classification rules were extracted, thus forming the proposed predictive model of classification. In the best scenario, a correct classification rate of 84% accuracy was obtained. Data mining is a reality within many organizations and can be a strong ally in fulfilling the, trivial, task of knowledge discovery in corporate databases.Pontifícia Universidade Católica de GoiásEscola de Engenharia::Curso de Engenharia de ProduçãoBrasilPUC GoiásPrograma de Pós-Graduação STRICTO SENSU em Engenharia de Produção e SistemasDantas, Maria José Pereirahttp://lattes.cnpq.br/5115002204148904Marques, Thyago Carvalhohttp://lattes.cnpq.br/1763926064124591Menezes, José Elmo dehttp://lattes.cnpq.br/9654702573176547Rocha, Santiago Meireles2018-02-15T18:00:36Z2017-08-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRocha, Santiago Meireles. MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO. 2017. 78 f. Dissertação (Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas) - Pontifícia Universidade Católica de Goiás, Goiânia-GO.http://tede2.pucgoias.edu.br:8080/handle/tede/3892porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás)instname:Pontifícia Universidade Católica de Goiás (PUC-GO)instacron:PUC_GO2018-02-16T03:00:14Zoai:ambar:tede/3892Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucgoias.edu.br:8080/http://tede2.pucgoias.edu.br:8080/oai/requesttede@pucgoias.edu.br||tede@pucgoias.edu.bropendoar:65932018-02-16T03:00:14Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) - Pontifícia Universidade Católica de Goiás (PUC-GO)false |
dc.title.none.fl_str_mv |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO |
title |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO |
spellingShingle |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO Rocha, Santiago Meireles Sonegação Fiscal, Árvore de Decisão, DCBD, WEKA Tax evasion, Decision tree, KDD, WEKA ENGENHARIAS::ENGENHARIA DE PRODUCAO |
title_short |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO |
title_full |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO |
title_fullStr |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO |
title_full_unstemmed |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO |
title_sort |
MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO |
author |
Rocha, Santiago Meireles |
author_facet |
Rocha, Santiago Meireles |
author_role |
author |
dc.contributor.none.fl_str_mv |
Dantas, Maria José Pereira http://lattes.cnpq.br/5115002204148904 Marques, Thyago Carvalho http://lattes.cnpq.br/1763926064124591 Menezes, José Elmo de http://lattes.cnpq.br/9654702573176547 |
dc.contributor.author.fl_str_mv |
Rocha, Santiago Meireles |
dc.subject.por.fl_str_mv |
Sonegação Fiscal, Árvore de Decisão, DCBD, WEKA Tax evasion, Decision tree, KDD, WEKA ENGENHARIAS::ENGENHARIA DE PRODUCAO |
topic |
Sonegação Fiscal, Árvore de Decisão, DCBD, WEKA Tax evasion, Decision tree, KDD, WEKA ENGENHARIAS::ENGENHARIA DE PRODUCAO |
description |
Com o aumento exponencial do volume de dados armazenados e o alto potencial de conhecimento oculto nesses dados que pode auxiliar nas estratégias e nas tomadas de decisão das organizações, muito vem se investido em tecnologia da informação e telecomunicação. A presente dissertação teve como objetivo aplicar o processo de Descoberta do Conhecimento em Base de Dados (DCBD) a fim de classificar os contribuintes de ICMS da SEFAZ-GO em Alto Sonegador e Baixo Sonegador, por meio da tarefa de mineração de dados Classificação Supervisionada, implementada pelo algoritmo J48, na plataforma computacional WEKA. Foram realizados 3 experimentos com uma amostra de dados de contribuintes de ICMS do setor atacadista do município de Goiânia-GO, com atributos selecionados a partir do Código do Tributário do Estado de Goiás. Durante os experimentos foram aplicados os algoritmos AttributeSelection e Discretize, para a redução de atributos e transformação das variáveis contínuas em discretas, respectivamente. Os índices estatísticos Matriz de Confusão e Coeficiente de Kappa foram utilizados como métricas de validação do modelo proposto. Após cada experimento, regras de classificação foram extraídas formando assim o modelo preditivo proposto de classificação. Obteve-se, no melhor cenário, uma taxa de classificação correta de 84% de acerto. A mineração de dados é uma realidade dentro de muitas organizações e pode ser uma forte aliada no cumprimento da, nada trivial, tarefa de descoberta de conhecimento nas bases de dados corporativas. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-08-18 2018-02-15T18:00:36Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
Rocha, Santiago Meireles. MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO. 2017. 78 f. Dissertação (Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas) - Pontifícia Universidade Católica de Goiás, Goiânia-GO. http://tede2.pucgoias.edu.br:8080/handle/tede/3892 |
identifier_str_mv |
Rocha, Santiago Meireles. MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO. 2017. 78 f. Dissertação (Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas) - Pontifícia Universidade Católica de Goiás, Goiânia-GO. |
url |
http://tede2.pucgoias.edu.br:8080/handle/tede/3892 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica de Goiás Escola de Engenharia::Curso de Engenharia de Produção Brasil PUC Goiás Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica de Goiás Escola de Engenharia::Curso de Engenharia de Produção Brasil PUC Goiás Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) instname:Pontifícia Universidade Católica de Goiás (PUC-GO) instacron:PUC_GO |
instname_str |
Pontifícia Universidade Católica de Goiás (PUC-GO) |
instacron_str |
PUC_GO |
institution |
PUC_GO |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) - Pontifícia Universidade Católica de Goiás (PUC-GO) |
repository.mail.fl_str_mv |
tede@pucgoias.edu.br||tede@pucgoias.edu.br |
_version_ |
1809202268083322880 |