MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO

Detalhes bibliográficos
Autor(a) principal: Rocha, Santiago Meireles
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás)
Texto Completo: http://tede2.pucgoias.edu.br:8080/handle/tede/3892
Resumo: Com o aumento exponencial do volume de dados armazenados e o alto potencial de conhecimento oculto nesses dados que pode auxiliar nas estratégias e nas tomadas de decisão das organizações, muito vem se investido em tecnologia da informação e telecomunicação. A presente dissertação teve como objetivo aplicar o processo de Descoberta do Conhecimento em Base de Dados (DCBD) a fim de classificar os contribuintes de ICMS da SEFAZ-GO em Alto Sonegador e Baixo Sonegador, por meio da tarefa de mineração de dados Classificação Supervisionada, implementada pelo algoritmo J48, na plataforma computacional WEKA. Foram realizados 3 experimentos com uma amostra de dados de contribuintes de ICMS do setor atacadista do município de Goiânia-GO, com atributos selecionados a partir do Código do Tributário do Estado de Goiás. Durante os experimentos foram aplicados os algoritmos AttributeSelection e Discretize, para a redução de atributos e transformação das variáveis contínuas em discretas, respectivamente. Os índices estatísticos Matriz de Confusão e Coeficiente de Kappa foram utilizados como métricas de validação do modelo proposto. Após cada experimento, regras de classificação foram extraídas formando assim o modelo preditivo proposto de classificação. Obteve-se, no melhor cenário, uma taxa de classificação correta de 84% de acerto. A mineração de dados é uma realidade dentro de muitas organizações e pode ser uma forte aliada no cumprimento da, nada trivial, tarefa de descoberta de conhecimento nas bases de dados corporativas.
id PUC_GO_e6a602602c92705c4cc39030cee8de67
oai_identifier_str oai:ambar:tede/3892
network_acronym_str PUC_GO
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás)
repository_id_str 6593
spelling MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GOSonegação Fiscal, Árvore de Decisão, DCBD, WEKATax evasion, Decision tree, KDD, WEKAENGENHARIAS::ENGENHARIA DE PRODUCAOCom o aumento exponencial do volume de dados armazenados e o alto potencial de conhecimento oculto nesses dados que pode auxiliar nas estratégias e nas tomadas de decisão das organizações, muito vem se investido em tecnologia da informação e telecomunicação. A presente dissertação teve como objetivo aplicar o processo de Descoberta do Conhecimento em Base de Dados (DCBD) a fim de classificar os contribuintes de ICMS da SEFAZ-GO em Alto Sonegador e Baixo Sonegador, por meio da tarefa de mineração de dados Classificação Supervisionada, implementada pelo algoritmo J48, na plataforma computacional WEKA. Foram realizados 3 experimentos com uma amostra de dados de contribuintes de ICMS do setor atacadista do município de Goiânia-GO, com atributos selecionados a partir do Código do Tributário do Estado de Goiás. Durante os experimentos foram aplicados os algoritmos AttributeSelection e Discretize, para a redução de atributos e transformação das variáveis contínuas em discretas, respectivamente. Os índices estatísticos Matriz de Confusão e Coeficiente de Kappa foram utilizados como métricas de validação do modelo proposto. Após cada experimento, regras de classificação foram extraídas formando assim o modelo preditivo proposto de classificação. Obteve-se, no melhor cenário, uma taxa de classificação correta de 84% de acerto. A mineração de dados é uma realidade dentro de muitas organizações e pode ser uma forte aliada no cumprimento da, nada trivial, tarefa de descoberta de conhecimento nas bases de dados corporativas.With the exponential increase in the volume of data stored and the high potential for hidden knowledge in these data that can aid in the strategies and decision making of organizations, much has been invested in information technology and telecommunication. The purpose of this dissertation was to apply the Knowledge Discovery in Database (DCBD) process in order to classify the taxpayers of SEFAZ-GO ICMS in High Eviction and Low Eviction, through the task of data mining Supervised Classification, Implemented by the algorithm J48, on the WEKA computing platform. Three experiments were carried out with a sample of ICMS taxpayers data from the wholesale sector of the city of Goiânia-GO, with attributes selected from the Tax Code of the State of Goiás. During the experiments, the AttributeSelection and Discretize algorithms were applied. Reduction of attributes and transformation of the continuous variables into discrete ones, respectively. The statistical indices Confusion Matrix and Kappa Coefficient were used as validation metrics of the proposed model. After each experiment, classification rules were extracted, thus forming the proposed predictive model of classification. In the best scenario, a correct classification rate of 84% accuracy was obtained. Data mining is a reality within many organizations and can be a strong ally in fulfilling the, trivial, task of knowledge discovery in corporate databases.Pontifícia Universidade Católica de GoiásEscola de Engenharia::Curso de Engenharia de ProduçãoBrasilPUC GoiásPrograma de Pós-Graduação STRICTO SENSU em Engenharia de Produção e SistemasDantas, Maria José Pereirahttp://lattes.cnpq.br/5115002204148904Marques, Thyago Carvalhohttp://lattes.cnpq.br/1763926064124591Menezes, José Elmo dehttp://lattes.cnpq.br/9654702573176547Rocha, Santiago Meireles2018-02-15T18:00:36Z2017-08-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRocha, Santiago Meireles. MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO. 2017. 78 f. Dissertação (Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas) - Pontifícia Universidade Católica de Goiás, Goiânia-GO.http://tede2.pucgoias.edu.br:8080/handle/tede/3892porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás)instname:Pontifícia Universidade Católica de Goiás (PUC-GO)instacron:PUC_GO2018-02-16T03:00:14Zoai:ambar:tede/3892Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucgoias.edu.br:8080/http://tede2.pucgoias.edu.br:8080/oai/requesttede@pucgoias.edu.br||tede@pucgoias.edu.bropendoar:65932018-02-16T03:00:14Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) - Pontifícia Universidade Católica de Goiás (PUC-GO)false
dc.title.none.fl_str_mv MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
title MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
spellingShingle MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
Rocha, Santiago Meireles
Sonegação Fiscal, Árvore de Decisão, DCBD, WEKA
Tax evasion, Decision tree, KDD, WEKA
ENGENHARIAS::ENGENHARIA DE PRODUCAO
title_short MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
title_full MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
title_fullStr MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
title_full_unstemmed MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
title_sort MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO
author Rocha, Santiago Meireles
author_facet Rocha, Santiago Meireles
author_role author
dc.contributor.none.fl_str_mv Dantas, Maria José Pereira
http://lattes.cnpq.br/5115002204148904
Marques, Thyago Carvalho
http://lattes.cnpq.br/1763926064124591
Menezes, José Elmo de
http://lattes.cnpq.br/9654702573176547
dc.contributor.author.fl_str_mv Rocha, Santiago Meireles
dc.subject.por.fl_str_mv Sonegação Fiscal, Árvore de Decisão, DCBD, WEKA
Tax evasion, Decision tree, KDD, WEKA
ENGENHARIAS::ENGENHARIA DE PRODUCAO
topic Sonegação Fiscal, Árvore de Decisão, DCBD, WEKA
Tax evasion, Decision tree, KDD, WEKA
ENGENHARIAS::ENGENHARIA DE PRODUCAO
description Com o aumento exponencial do volume de dados armazenados e o alto potencial de conhecimento oculto nesses dados que pode auxiliar nas estratégias e nas tomadas de decisão das organizações, muito vem se investido em tecnologia da informação e telecomunicação. A presente dissertação teve como objetivo aplicar o processo de Descoberta do Conhecimento em Base de Dados (DCBD) a fim de classificar os contribuintes de ICMS da SEFAZ-GO em Alto Sonegador e Baixo Sonegador, por meio da tarefa de mineração de dados Classificação Supervisionada, implementada pelo algoritmo J48, na plataforma computacional WEKA. Foram realizados 3 experimentos com uma amostra de dados de contribuintes de ICMS do setor atacadista do município de Goiânia-GO, com atributos selecionados a partir do Código do Tributário do Estado de Goiás. Durante os experimentos foram aplicados os algoritmos AttributeSelection e Discretize, para a redução de atributos e transformação das variáveis contínuas em discretas, respectivamente. Os índices estatísticos Matriz de Confusão e Coeficiente de Kappa foram utilizados como métricas de validação do modelo proposto. Após cada experimento, regras de classificação foram extraídas formando assim o modelo preditivo proposto de classificação. Obteve-se, no melhor cenário, uma taxa de classificação correta de 84% de acerto. A mineração de dados é uma realidade dentro de muitas organizações e pode ser uma forte aliada no cumprimento da, nada trivial, tarefa de descoberta de conhecimento nas bases de dados corporativas.
publishDate 2017
dc.date.none.fl_str_mv 2017-08-18
2018-02-15T18:00:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv Rocha, Santiago Meireles. MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO. 2017. 78 f. Dissertação (Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas) - Pontifícia Universidade Católica de Goiás, Goiânia-GO.
http://tede2.pucgoias.edu.br:8080/handle/tede/3892
identifier_str_mv Rocha, Santiago Meireles. MINERAÇÃO DE DADOS APLICADA À CLASSIFICAÇÃO DOS CONTRIBUINTES DE ICMS DA SEFAZ-GO. 2017. 78 f. Dissertação (Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas) - Pontifícia Universidade Católica de Goiás, Goiânia-GO.
url http://tede2.pucgoias.edu.br:8080/handle/tede/3892
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica de Goiás
Escola de Engenharia::Curso de Engenharia de Produção
Brasil
PUC Goiás
Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas
publisher.none.fl_str_mv Pontifícia Universidade Católica de Goiás
Escola de Engenharia::Curso de Engenharia de Produção
Brasil
PUC Goiás
Programa de Pós-Graduação STRICTO SENSU em Engenharia de Produção e Sistemas
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás)
instname:Pontifícia Universidade Católica de Goiás (PUC-GO)
instacron:PUC_GO
instname_str Pontifícia Universidade Católica de Goiás (PUC-GO)
instacron_str PUC_GO
institution PUC_GO
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás)
collection Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_GOAIS (TEDE-PUC Goiás) - Pontifícia Universidade Católica de Goiás (PUC-GO)
repository.mail.fl_str_mv tede@pucgoias.edu.br||tede@pucgoias.edu.br
_version_ 1796791398185304064