Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos

Detalhes bibliográficos
Autor(a) principal: Vaqueiro, Ramon Dantas
Data de Publicação: 2022
Outros Autores: Escovedo, Tatiana
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
Texto Completo: https://www.repositorio.mar.mil.br/handle/ripcmb/845541
Resumo: O elevado poder de compra do Estado e a necessidade de se zelar pela correta aplicação dos recursos públicos suscita no cidadão grande preocupação.À luz dessa realidade, o legislador conferiu um tratamento diferenciado para as compras públicas e as submeteu a maiores níveis de transparência, determinando que seus dados passassem a ser disponibilizados abertamente. Em face da demanda popular e da disponibilidade de acesso a esse recurso, torna-se imperiosa as utilização pelos órgãos competentes.Todavia, parte significativa desses dados são textuais, ou seja, não estruturados, o que requer um diligente específico pré-processamento por parte de quem os utilize. Este artigo se debruça sobre uma base de dados correspondente aos materiais comprados pelo Governo Federal na modalidade pregão ao longo do ano de 2021.Objetivou-se agrupar as descrições textuais de compras semelhantes, permitindo sua comparação.Dentre as aplicações possíveis a partir do correto agrupamento, encontra-se a identificação de outliers nos preços das aquisições, sinalizando um indício de eventual impropriedade. Como resultado, obteve-se uma clusterização considerada satisfatória em 72% dos casos.
id MB_0deda4f68865364073cd854a1fb4856b
oai_identifier_str oai:www.repositorio.mar.mil.br:ripcmb/845541
network_acronym_str MB
network_name_str Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
repository_id_str
spelling Vaqueiro, Ramon DantasEscovedo, Tatiana2022-10-21T12:12:30Z2022-10-21T12:12:30Z2022https://www.repositorio.mar.mil.br/handle/ripcmb/845541O elevado poder de compra do Estado e a necessidade de se zelar pela correta aplicação dos recursos públicos suscita no cidadão grande preocupação.À luz dessa realidade, o legislador conferiu um tratamento diferenciado para as compras públicas e as submeteu a maiores níveis de transparência, determinando que seus dados passassem a ser disponibilizados abertamente. Em face da demanda popular e da disponibilidade de acesso a esse recurso, torna-se imperiosa as utilização pelos órgãos competentes.Todavia, parte significativa desses dados são textuais, ou seja, não estruturados, o que requer um diligente específico pré-processamento por parte de quem os utilize. Este artigo se debruça sobre uma base de dados correspondente aos materiais comprados pelo Governo Federal na modalidade pregão ao longo do ano de 2021.Objetivou-se agrupar as descrições textuais de compras semelhantes, permitindo sua comparação.Dentre as aplicações possíveis a partir do correto agrupamento, encontra-se a identificação de outliers nos preços das aquisições, sinalizando um indício de eventual impropriedade. Como resultado, obteve-se uma clusterização considerada satisfatória em 72% dos casos.Trabalho de Conclusão de Curso referente à Pós-Graduação Lato Sensu em Ciência de Dados realizada na PUC-Rio.The high purchasing power of the State and the need to ensure the correct application of public resources raises great concern amongcitizens.In light of this reality,the legislator granted a differentiated treatment to public purchases and submitted them to greater level softransparency,determining that their data would be made available openly. In view of popular demand and the availability of access to this resource, it suse by Public Bodies that a reem poweredisimperative.However, a significant part of this data is textual, which requires diligent and specific preprocessingby those who use it.This article focuses on a data base corresponding to materials purchased by the Federal Govern mentthroughout the year 2021. The objective was to group the textual descriptions of similar purchases, allowing their comparison.Among the possible applications from the correct grouping, there is the identification of outliers in the prices of acquisitions, signalingan indication of possible impropriety.As aresult,aclustering considered satisfactory was obtained in 72% of the cases.Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)Banco de dadosCompras públicasMineração de textoAprendizado de máquinaMachine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)instname:Marinha do Brasil (MB)instacron:MBORIGINALTCC_CT_IM_VAQUEIRO.pdfTCC_CT_IM_VAQUEIRO.pdfapplication/pdf343528https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/2/TCC_CT_IM_VAQUEIRO.pdf25d601cb31861f11f0a0e9bd683418fbMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-83272https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/3/license.txt8ff7ce654d5215cee2106f3e3b7eb37fMD53TEXTTCC_CT_IM_VAQUEIRO.pdf.txtTCC_CT_IM_VAQUEIRO.pdf.txtExtracted texttext/plain53400https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/4/TCC_CT_IM_VAQUEIRO.pdf.txt688ed4ef3e57f473d83e7a4506c73ac1MD54THUMBNAILTCC_CT_IM_VAQUEIRO.pdf.jpgTCC_CT_IM_VAQUEIRO.pdf.jpgGenerated Thumbnailimage/jpeg1672https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/5/TCC_CT_IM_VAQUEIRO.pdf.jpg84fa6cd20565d5ecb82da8582049d7b3MD55ripcmb/8455412023-05-12 10:21:55.49oai:www.repositorio.mar.mil.br:ripcmb/845541QW8gY29uY29yZGFyIGNvbSBlc3RhIGxpY2Vuw6dhLCBvIFNyLiBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSAgIGNvbmNlZGUobSkgICDDoCAgIE1BUklOSEEgIERPICAgQlJBU0lMLCAgIGdlc3RvcmEgICBkYSAgUmVkZSAgIEJJTSAgIGUgICBkbyAgIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIE1hcmluaGEgZG8gQnJhc2lsIChSSS1NQiksIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCBjb252ZXJ0ZXIgKGNvbW8gZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZGVwb3NpdGFkbyBlbSBmb3JtYXRvIGltcHJlc3NvLCBlbGV0csO0bmljbyBvdSBlbSBxdWFscXVlciBvdXRybyBtZWlvLiBPIFNyKHMpIGNvbmNvcmRhKG0pIHF1ZSBhIE1BUklOSEEgRE8gQlJBU0lMLCBnZXN0b3JhIGRhIFJlZGUgQklNIGUgZG8gUkktTUIsIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCBjb252ZXJ0ZXIgbyBhcnF1aXZvIGRlcG9zaXRhZG8gYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4gTyAgU3IocykgIHRhbWLDqW0gIGNvbmNvcmRhKG0pICBxdWUgIGEgIE1BUklOSEEgIERPICBCUkFTSUwsICBnZXN0b3JhICBkYSAgUmVkZSAgQklNICBlICBkbyAgUkktTUIsICBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGVzdGUgZGVww7NzaXRvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUvb3UgcHJlc2VydmHDp8Ojby5PICBTcihzKSAgZGVjbGFyYShtKSAgcXVlICBhICBhcHJlc2VudGHDp8OjbyAgZG8gIHNldSAgdHJhYmFsaG8gIMOpICBvcmlnaW5hbCAgZSAgcXVlICBvICBTcihzKSAgcG9kZShtKSAgY29uY2VkZXIgIG9zICBkaXJlaXRvcyAgY29udGlkb3MgIG5lc3RhICBsaWNlbsOnYS4gIE8gIFNyKHMpICB0YW1iw6ltICBkZWNsYXJhKG0pICBxdWUgIG8gIGVudmlvICDDqSAgZGUgIHNldSAgY29uaGVjaW1lbnRvICBlICBuw6NvICBpbmZyaW5nZSAgb3MgIGRpcmVpdG9zICBhdXRvcmFpcyAgZGUgIG91dHJhICBwZXNzb2EgIG91ICBpbnN0aXR1acOnw6NvLiAgQ2FzbyAgbyAgZG9jdW1lbnRvICBhICBzZXIgIGRlcG9zaXRhZG8gIGNvbnRlbmhhICBtYXRlcmlhbCAgcGFyYSAgbyAgcXVhbCAgbyAgU3IocykgIG7Do28gIGRldMOpbSAgYSAgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBkZSBhdXRvcmFpcywgbyBTcihzKSBkZWNsYXJhKG0pIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgY29uY2VkZXIgw6AgTUFSSU5IQSBETyBCUkFTSUwsIGdlc3RvcmEgZGEgUmVkZSBCSU0gZSBkbyBSSS1NQiwgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSBlIHF1ZSBvcyBtYXRlcmlhaXMgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zLCBlc3TDo28gZGV2aWRhbWVudGUgaWRlbnRpZmljYWRvcyBlIHJlY29uaGVjaWRvcyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZGEgYXByZXNlbnRhw6fDo28uIENBU08gIE8gIFRSQUJBTEhPICBERVBPU0lUQURPICBURU5IQSAgU0lETyAgRklOQU5DSUFETyAgT1UgIEFQT0lBRE8gIFBPUiAgVU0gIMOTUkfDg08sICBRVUUgIE7Dg08gIEEgIElOU1RJVFVJw4fDg08gIERFU1RFICBSRVNQT1NJVMOTUklPOiAgTyAgU1IgIERFQ0xBUkEgIFRFUiAgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVPDg08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQcOHw5VFUyBSRVFVRVJJREFTIFBFTE8gQ09OVFJBVE8gT1UgQUNPUkRPLk8gICAgU3IocykgICAgY29uY29yZGEobSkgICAgY29tICAgIGEgICAgTGljZW7Dp2EgICAgQ3JlYXRpdmUgICAgQ29tbW9ucyAgICBhZG90YWRhICAgIHBhcmEgICAgZXN0ZSAgICBSZXBvc2l0w7NyaW8gICAgSW5zdGl0dWNpb25hbCAgICBxdWUgICAgY29uY2VkZSAgICBvICAgIGRpcmVpdG8gICAgZGUgICAgQ09NUEFSVElMSEFSICAgIGUgICAgYXMgICAgcmVzdHJpw6fDtWVzICAgIGRlICAgIEFUUklCVUnDh8ODTywgICAgTsODTyAgICBDT01FUkNJQUxJWkHDh8ODTyAgICBFICAgIFNFTSAgICBERVJJVkHDh8OVRVMuQ09NUEFSVElMSEFSOiAgY29waWFyICBlICByZWRpc3RyaWJ1aXIgIG8gIG1hdGVyaWFsICBlbSAgcXVhbHF1ZXIgIHN1cG9ydGUgIG91ICBmb3JtYXRvICBlICBvICBsaWNlbmNpYW50ZSBuw6NvIHBvZGUgcmV2b2dhciBlc3RlcyBkaXJlaXRvcyBkZXNkZSBxdWUgbyBTcihzKSByZXNwZWl0ZShtKSBvcyB0ZXJtb3MgZGEgbGljZW7Dp2EuQVRSSUJVScOHw4NPOiAgbyAgU3IocykgIGRldmUobSkgIGRhciAgbyAgY3LDqWRpdG8gIGFwcm9wcmlhZG8sICBwcm92ZXIgIHVtICBsaW5rICBwYXJhICBhICBsaWNlbsOnYSAgZSAgaW5kaWNhciAgc2UgIG11ZGFuw6dhcyAgZm9yYW0gIGZlaXRhcy4gIE8gIFNyKHMpICBkZXZlKG0pICBmYXrDqi1sbyAgZW0gIHF1YWxxdWVyICBjaXJjdW5zdMOibmNpYSByYXpvw6F2ZWwsIG1hcyBkZSBtYW5laXJhIGFsZ3VtYSBxdWUgc3VnaXJhIGFvIGxpY2VuY2lhbnRlIGEgYXBvaWFyIG8gU3Iocykgb3UgbyBzZXUgdXNvLk7Dg08gQ09NRVJDSUFMOiBvIFNyKHMpIG7Do28gcG9kZShtKSB1c2FyIG8gbWF0ZXJpYWwgcGFyYSBmaW5zIGNvbWVyY2lhaXMuU0VNIERFUklWQcOHw5VFUzogc2UgbyBTcihzKSByZW1peGFyKGVtKSwgdHJhbnNmb3JtYXIoZW0pIG91IGNyaWFyKGVtKSBhIHBhcnRpciBkbyBtYXRlcmlhbCwgbyBTcihzKSBuw6NvIHBvZGUobSkgZGlzdHJpYnVpciBvIG1hdGVyaWFsIG1vZGlmaWNhZG8uU0VNIFJFU1RSScOHw5VFUyBBRElDSU9OQUlTOiBvIFNyKHMpIG7Do28gcG9kZShtKSBhcGxpY2FyIHRlcm1vcyBqdXLDrWRpY29zIG91IG1lZGlkYXMgZGUgY2Fyw6F0ZXIgdGVjbm9sw7NnaWNvIHF1ZSByZXN0cmluamFtIGxlZ2FsbWVudGUgb3V0cm9zIGRlIGZhemVyZW0gYWxnbyBxdWUgYSBsaWNlbsOnYSBwZXJtaXRhLkEgUmVkZSBCSU0gZSBvIFJJLU1CIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvIHNldShzKSBub21lKHMpIGNvbW8gYXV0b3IoZXMpIG91IHRpdHVsYXIoZXMpIGRvIGRpcmVpdG8gZGUgYXV0b3IoZXMpIGRvIGRvY3VtZW50byBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttps://www.repositorio.mar.mil.br/oai/requestdphdm.repositorio@marinha.mil.bropendoar:2023-05-12T13:21:55Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)false
dc.title.pt_BR.fl_str_mv Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
title Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
spellingShingle Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
Vaqueiro, Ramon Dantas
Compras públicas
Mineração de texto
Aprendizado de máquina
Banco de dados
title_short Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
title_full Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
title_fullStr Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
title_full_unstemmed Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
title_sort Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
author Vaqueiro, Ramon Dantas
author_facet Vaqueiro, Ramon Dantas
Escovedo, Tatiana
author_role author
author2 Escovedo, Tatiana
author2_role author
dc.contributor.author.fl_str_mv Vaqueiro, Ramon Dantas
Escovedo, Tatiana
dc.subject.por.fl_str_mv Compras públicas
Mineração de texto
Aprendizado de máquina
topic Compras públicas
Mineração de texto
Aprendizado de máquina
Banco de dados
dc.subject.dgpm.pt_BR.fl_str_mv Banco de dados
description O elevado poder de compra do Estado e a necessidade de se zelar pela correta aplicação dos recursos públicos suscita no cidadão grande preocupação.À luz dessa realidade, o legislador conferiu um tratamento diferenciado para as compras públicas e as submeteu a maiores níveis de transparência, determinando que seus dados passassem a ser disponibilizados abertamente. Em face da demanda popular e da disponibilidade de acesso a esse recurso, torna-se imperiosa as utilização pelos órgãos competentes.Todavia, parte significativa desses dados são textuais, ou seja, não estruturados, o que requer um diligente específico pré-processamento por parte de quem os utilize. Este artigo se debruça sobre uma base de dados correspondente aos materiais comprados pelo Governo Federal na modalidade pregão ao longo do ano de 2021.Objetivou-se agrupar as descrições textuais de compras semelhantes, permitindo sua comparação.Dentre as aplicações possíveis a partir do correto agrupamento, encontra-se a identificação de outliers nos preços das aquisições, sinalizando um indício de eventual impropriedade. Como resultado, obteve-se uma clusterização considerada satisfatória em 72% dos casos.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-10-21T12:12:30Z
dc.date.available.fl_str_mv 2022-10-21T12:12:30Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.repositorio.mar.mil.br/handle/ripcmb/845541
url https://www.repositorio.mar.mil.br/handle/ripcmb/845541
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)
dc.source.none.fl_str_mv reponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
instname:Marinha do Brasil (MB)
instacron:MB
instname_str Marinha do Brasil (MB)
instacron_str MB
institution MB
reponame_str Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
collection Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
bitstream.url.fl_str_mv https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/2/TCC_CT_IM_VAQUEIRO.pdf
https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/3/license.txt
https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/4/TCC_CT_IM_VAQUEIRO.pdf.txt
https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/5/TCC_CT_IM_VAQUEIRO.pdf.jpg
bitstream.checksum.fl_str_mv 25d601cb31861f11f0a0e9bd683418fb
8ff7ce654d5215cee2106f3e3b7eb37f
688ed4ef3e57f473d83e7a4506c73ac1
84fa6cd20565d5ecb82da8582049d7b3
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)
repository.mail.fl_str_mv dphdm.repositorio@marinha.mil.br
_version_ 1798310212404248576