Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte

Detalhes bibliográficos
Autor(a) principal: Eduardo de Mattos Pinto Coelho
Data de Publicação: 2012
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ECID-92AP35
Resumo: This research project aims at the improvement of technology support for detecting, analyzing and fighting tax evasion in Service of Any Kind Tax- ISSQN - from recovery and processing large volumes of data. The hypothesis is that the association of methodologies and techniques of ontologies and fuzzy systems, can even help facilitate the success of data mining in the recovery of these large volumes of data. This hypothesis is based on three premises. The first premise is that the solution uses the capture, processing, modeling, representation and formal incorporation of domain knowledge, in particular, constituted by thecollective knowledge of experts. The second premise is that ontologies are perfectlysuited to the task of knowledge incorporation. This adequacy is obtained in view ofthe characteristics of ontologies in explicit, formalize, verify and consolidate the knowledge, making them sharable, reusable and interoperable. In addition, the knowledge represented and incorporated is naturally used for classification, from the inherent inference mechanisms of development tools ontologies, and the mechanisms ofinferences that can be added to them. The third premise is that, considering that the collective knowledge of experts is vague and subjective in nature, methodologies and techniques in the area of fuzzy systems are adequate to capture, treat andmodel this knowledge. Then, we have developed a solution for the pre-and post-processing of data mining, focused on modeling expert knowledge of nature vague and subjective. This vague and subjective knowledge is modeled to attributes with fuzzy systems techniques, guiding the process of data mining, and generating a subjective measure that supports the analysis and interpretation of results that otherwise would be more laborious, difficult or even impossible to be performed. Thus, we present an effective solution for increasing tax revenue through the identification of evidence of fraud and tax evasion on imported services for companies of Belo Horizonte. Based on this approach, tests and simulations conducted, we can reduce the numberof rules of interest generated by data mining by 42%. Comparing the number of records in data mining detected by this approach, with the number of known records involving fraud proven, we obtained an overall success rate of 95.88%. This solution has the potential to be applied in other situations, and in wide areas of application in the public and private sphere. The project explores the convergence of skills developed by three different institutions: the School of Information Science at UFMG, the Department of Computer Science at UFMG and the Finance City Office of BeloHorizonte.
id UFMG_db2e2bd4a5a14af03a729291760e3669
oai_identifier_str oai:repositorio.ufmg.br:1843/ECID-92AP35
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo HorizonteCiência da InformaçãoCiência da informaçãoRepresentação do conhecimento (Teoria da informação)Ontologias (Recuperação da informação)Mineração de dados (Computação)This research project aims at the improvement of technology support for detecting, analyzing and fighting tax evasion in Service of Any Kind Tax- ISSQN - from recovery and processing large volumes of data. The hypothesis is that the association of methodologies and techniques of ontologies and fuzzy systems, can even help facilitate the success of data mining in the recovery of these large volumes of data. This hypothesis is based on three premises. The first premise is that the solution uses the capture, processing, modeling, representation and formal incorporation of domain knowledge, in particular, constituted by thecollective knowledge of experts. The second premise is that ontologies are perfectlysuited to the task of knowledge incorporation. This adequacy is obtained in view ofthe characteristics of ontologies in explicit, formalize, verify and consolidate the knowledge, making them sharable, reusable and interoperable. In addition, the knowledge represented and incorporated is naturally used for classification, from the inherent inference mechanisms of development tools ontologies, and the mechanisms ofinferences that can be added to them. The third premise is that, considering that the collective knowledge of experts is vague and subjective in nature, methodologies and techniques in the area of fuzzy systems are adequate to capture, treat andmodel this knowledge. Then, we have developed a solution for the pre-and post-processing of data mining, focused on modeling expert knowledge of nature vague and subjective. This vague and subjective knowledge is modeled to attributes with fuzzy systems techniques, guiding the process of data mining, and generating a subjective measure that supports the analysis and interpretation of results that otherwise would be more laborious, difficult or even impossible to be performed. Thus, we present an effective solution for increasing tax revenue through the identification of evidence of fraud and tax evasion on imported services for companies of Belo Horizonte. Based on this approach, tests and simulations conducted, we can reduce the numberof rules of interest generated by data mining by 42%. Comparing the number of records in data mining detected by this approach, with the number of known records involving fraud proven, we obtained an overall success rate of 95.88%. This solution has the potential to be applied in other situations, and in wide areas of application in the public and private sphere. The project explores the convergence of skills developed by three different institutions: the School of Information Science at UFMG, the Department of Computer Science at UFMG and the Finance City Office of BeloHorizonte.Este projeto de pesquisa tem como objetivo o aprimoramento de tecnologia de suporte à detecção, análise e combate a fraudes fiscais no Imposto Sobre Serviços de Qualquer Natureza ISSQN a partir da recuperação e processamento de grande volume de dados. A hipótese que lançamos é que a associação de metodologias e técnicas de ontologias e sistemas difusos pode auxiliar e mesmo viabilizar o sucesso da mineração de dados na recuperação destes grandes volumes de dados. Esta hipótese fundamenta-se em três premissas. A primeira premissa é que a solução passa pela necessidade da captura, tratamento, modelagem, representação formal e incorporação do conhecimentode domínio, em especial, o constituído pelo conhecimento coletivo de especialistas. A segunda premissa é que ontologias adequam-se perfeitamente à tarefa dessa incorporação de conhecimento. Essa adequação se faz em vista das características das ontologias em explicitar, formalizar, verificar, e consolidar conhecimentos, tornando-os compartilháveis, reutilizáveis e interoperáveis. Além disso, o conhecimento representado e incorporado é naturalmente utilizado para fins de classificação, a partir dos mecanismos de inferências inerentes às ferramentas de desenvolvimento de ontologias, e aos mecanismos de inferências que podem ser agregados a elas. A terceira premissa é que, considerando-se que esse conhecimento coletivo de especialistas é de natureza vaga e subjetiva, as metodologias e técnicas da área de sistemas difusos são adequadas para capturar, tratar e modelar esse conhecimento. Com isto, desenvolvemos uma solução para o pré e pós-processamento de dados na mineração, focada na modelagem de conhecimento especialista de natureza vaga e subjetiva. Este conhecimento vago e subjetivo é modelado em atributos com técnicas de sistemas difusos, guiando o processo demineração de dados, e gerando uma medida subjetiva que suporta a análise e interpretação de resultados, que de outro modo, seria mais laboriosa, difícil oumesmo impossível de ser realizada. Desse modo, apresentamos uma solução efetiva para o aumento da arrecadação tributária, através da identificação deevidências de fraudes e evasão tributária em serviços importados por empresas de Belo Horizonte. Com base nesta abordagem, nos testes e simulações realizados, pudemos reduzir o número de regras de interesse geradas pela mineração de dadosem 42%. Comparando-se o número de registros detectados na mineração de dados por esta abordagem, com o número de registros conhecidos envolvendo fraudes comprovadas, obtivemos uma taxa de sucesso global de 95,88%. Esta solução tem o potencial para ser aplicada em outras situações, e em amplas áreas de aplicaçãona esfera pública e privada. O projeto explora a convergência das habilidades desenvolvidas por três diferentes instituições: a Escola de Ciência da Informação da UFMG, o Departamento de Ciência da Computação da UFMG e a Secretaria Municipal de Finanças da Prefeitura de Belo Horizonte.Universidade Federal de Minas GeraisUFMGMarcello Peixoto BaxWagner Meira JuniorAlberto Henrique Frade LaenderMauricio Barcellos AlmeidaRenata Maria Abrantes Baracho PortoFernando Silva ParreirasFrederico Luiz Gonçalves de FreitasEduardo de Mattos Pinto Coelho2019-08-10T00:21:38Z2019-08-10T00:21:38Z2012-11-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/1843/ECID-92AP35info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2019-11-14T10:03:00Zoai:repositorio.ufmg.br:1843/ECID-92AP35Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2019-11-14T10:03Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
spellingShingle Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
Eduardo de Mattos Pinto Coelho
Ciência da Informação
Ciência da informação
Representação do conhecimento (Teoria da informação)
Ontologias (Recuperação da informação)
Mineração de dados (Computação)
title_short Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_full Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_fullStr Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_full_unstemmed Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
title_sort Ontologias difusas no suporte à mineração de dados: aplicações na Secretaria de Finanças da Prefeitura Municipal de Belo Horizonte
author Eduardo de Mattos Pinto Coelho
author_facet Eduardo de Mattos Pinto Coelho
author_role author
dc.contributor.none.fl_str_mv Marcello Peixoto Bax
Wagner Meira Junior
Alberto Henrique Frade Laender
Mauricio Barcellos Almeida
Renata Maria Abrantes Baracho Porto
Fernando Silva Parreiras
Frederico Luiz Gonçalves de Freitas
dc.contributor.author.fl_str_mv Eduardo de Mattos Pinto Coelho
dc.subject.por.fl_str_mv Ciência da Informação
Ciência da informação
Representação do conhecimento (Teoria da informação)
Ontologias (Recuperação da informação)
Mineração de dados (Computação)
topic Ciência da Informação
Ciência da informação
Representação do conhecimento (Teoria da informação)
Ontologias (Recuperação da informação)
Mineração de dados (Computação)
description This research project aims at the improvement of technology support for detecting, analyzing and fighting tax evasion in Service of Any Kind Tax- ISSQN - from recovery and processing large volumes of data. The hypothesis is that the association of methodologies and techniques of ontologies and fuzzy systems, can even help facilitate the success of data mining in the recovery of these large volumes of data. This hypothesis is based on three premises. The first premise is that the solution uses the capture, processing, modeling, representation and formal incorporation of domain knowledge, in particular, constituted by thecollective knowledge of experts. The second premise is that ontologies are perfectlysuited to the task of knowledge incorporation. This adequacy is obtained in view ofthe characteristics of ontologies in explicit, formalize, verify and consolidate the knowledge, making them sharable, reusable and interoperable. In addition, the knowledge represented and incorporated is naturally used for classification, from the inherent inference mechanisms of development tools ontologies, and the mechanisms ofinferences that can be added to them. The third premise is that, considering that the collective knowledge of experts is vague and subjective in nature, methodologies and techniques in the area of fuzzy systems are adequate to capture, treat andmodel this knowledge. Then, we have developed a solution for the pre-and post-processing of data mining, focused on modeling expert knowledge of nature vague and subjective. This vague and subjective knowledge is modeled to attributes with fuzzy systems techniques, guiding the process of data mining, and generating a subjective measure that supports the analysis and interpretation of results that otherwise would be more laborious, difficult or even impossible to be performed. Thus, we present an effective solution for increasing tax revenue through the identification of evidence of fraud and tax evasion on imported services for companies of Belo Horizonte. Based on this approach, tests and simulations conducted, we can reduce the numberof rules of interest generated by data mining by 42%. Comparing the number of records in data mining detected by this approach, with the number of known records involving fraud proven, we obtained an overall success rate of 95.88%. This solution has the potential to be applied in other situations, and in wide areas of application in the public and private sphere. The project explores the convergence of skills developed by three different institutions: the School of Information Science at UFMG, the Department of Computer Science at UFMG and the Finance City Office of BeloHorizonte.
publishDate 2012
dc.date.none.fl_str_mv 2012-11-05
2019-08-10T00:21:38Z
2019-08-10T00:21:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ECID-92AP35
url http://hdl.handle.net/1843/ECID-92AP35
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
UFMG
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1816829888810713088