Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Outros Autores: | |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
Texto Completo: | https://www.repositorio.mar.mil.br/handle/ripcmb/845541 |
Resumo: | O elevado poder de compra do Estado e a necessidade de se zelar pela correta aplicação dos recursos públicos suscita no cidadão grande preocupação.À luz dessa realidade, o legislador conferiu um tratamento diferenciado para as compras públicas e as submeteu a maiores níveis de transparência, determinando que seus dados passassem a ser disponibilizados abertamente. Em face da demanda popular e da disponibilidade de acesso a esse recurso, torna-se imperiosa as utilização pelos órgãos competentes.Todavia, parte significativa desses dados são textuais, ou seja, não estruturados, o que requer um diligente específico pré-processamento por parte de quem os utilize. Este artigo se debruça sobre uma base de dados correspondente aos materiais comprados pelo Governo Federal na modalidade pregão ao longo do ano de 2021.Objetivou-se agrupar as descrições textuais de compras semelhantes, permitindo sua comparação.Dentre as aplicações possíveis a partir do correto agrupamento, encontra-se a identificação de outliers nos preços das aquisições, sinalizando um indício de eventual impropriedade. Como resultado, obteve-se uma clusterização considerada satisfatória em 72% dos casos. |
id |
MB_0deda4f68865364073cd854a1fb4856b |
---|---|
oai_identifier_str |
oai:www.repositorio.mar.mil.br:ripcmb/845541 |
network_acronym_str |
MB |
network_name_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
repository_id_str |
|
spelling |
Vaqueiro, Ramon DantasEscovedo, Tatiana2022-10-21T12:12:30Z2022-10-21T12:12:30Z2022https://www.repositorio.mar.mil.br/handle/ripcmb/845541O elevado poder de compra do Estado e a necessidade de se zelar pela correta aplicação dos recursos públicos suscita no cidadão grande preocupação.À luz dessa realidade, o legislador conferiu um tratamento diferenciado para as compras públicas e as submeteu a maiores níveis de transparência, determinando que seus dados passassem a ser disponibilizados abertamente. Em face da demanda popular e da disponibilidade de acesso a esse recurso, torna-se imperiosa as utilização pelos órgãos competentes.Todavia, parte significativa desses dados são textuais, ou seja, não estruturados, o que requer um diligente específico pré-processamento por parte de quem os utilize. Este artigo se debruça sobre uma base de dados correspondente aos materiais comprados pelo Governo Federal na modalidade pregão ao longo do ano de 2021.Objetivou-se agrupar as descrições textuais de compras semelhantes, permitindo sua comparação.Dentre as aplicações possíveis a partir do correto agrupamento, encontra-se a identificação de outliers nos preços das aquisições, sinalizando um indício de eventual impropriedade. Como resultado, obteve-se uma clusterização considerada satisfatória em 72% dos casos.Trabalho de Conclusão de Curso referente à Pós-Graduação Lato Sensu em Ciência de Dados realizada na PUC-Rio.The high purchasing power of the State and the need to ensure the correct application of public resources raises great concern amongcitizens.In light of this reality,the legislator granted a differentiated treatment to public purchases and submitted them to greater level softransparency,determining that their data would be made available openly. In view of popular demand and the availability of access to this resource, it suse by Public Bodies that a reem poweredisimperative.However, a significant part of this data is textual, which requires diligent and specific preprocessingby those who use it.This article focuses on a data base corresponding to materials purchased by the Federal Govern mentthroughout the year 2021. The objective was to group the textual descriptions of similar purchases, allowing their comparison.Among the possible applications from the correct grouping, there is the identification of outliers in the prices of acquisitions, signalingan indication of possible impropriety.As aresult,aclustering considered satisfactory was obtained in 72% of the cases.Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)Banco de dadosCompras públicasMineração de textoAprendizado de máquinaMachine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)instname:Marinha do Brasil (MB)instacron:MBORIGINALTCC_CT_IM_VAQUEIRO.pdfTCC_CT_IM_VAQUEIRO.pdfapplication/pdf343528https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/2/TCC_CT_IM_VAQUEIRO.pdf25d601cb31861f11f0a0e9bd683418fbMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-83272https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/3/license.txt8ff7ce654d5215cee2106f3e3b7eb37fMD53TEXTTCC_CT_IM_VAQUEIRO.pdf.txtTCC_CT_IM_VAQUEIRO.pdf.txtExtracted texttext/plain53400https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/4/TCC_CT_IM_VAQUEIRO.pdf.txt688ed4ef3e57f473d83e7a4506c73ac1MD54THUMBNAILTCC_CT_IM_VAQUEIRO.pdf.jpgTCC_CT_IM_VAQUEIRO.pdf.jpgGenerated Thumbnailimage/jpeg1672https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/5/TCC_CT_IM_VAQUEIRO.pdf.jpg84fa6cd20565d5ecb82da8582049d7b3MD55ripcmb/8455412023-05-12 10:21:55.49oai:www.repositorio.mar.mil.br:ripcmb/845541QW8gY29uY29yZGFyIGNvbSBlc3RhIGxpY2Vuw6dhLCBvIFNyLiBhdXRvcihlcykgb3UgdGl0dWxhcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIG9icmEgYXF1aSBkZXNjcml0YSAgIGNvbmNlZGUobSkgICDDoCAgIE1BUklOSEEgIERPICAgQlJBU0lMLCAgIGdlc3RvcmEgICBkYSAgUmVkZSAgIEJJTSAgIGUgICBkbyAgIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIE1hcmluaGEgZG8gQnJhc2lsIChSSS1NQiksIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCBjb252ZXJ0ZXIgKGNvbW8gZGVmaW5pZG8gYWJhaXhvKSBlL291IGRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZGVwb3NpdGFkbyBlbSBmb3JtYXRvIGltcHJlc3NvLCBlbGV0csO0bmljbyBvdSBlbSBxdWFscXVlciBvdXRybyBtZWlvLiBPIFNyKHMpIGNvbmNvcmRhKG0pIHF1ZSBhIE1BUklOSEEgRE8gQlJBU0lMLCBnZXN0b3JhIGRhIFJlZGUgQklNIGUgZG8gUkktTUIsIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCBjb252ZXJ0ZXIgbyBhcnF1aXZvIGRlcG9zaXRhZG8gYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4gTyAgU3IocykgIHRhbWLDqW0gIGNvbmNvcmRhKG0pICBxdWUgIGEgIE1BUklOSEEgIERPICBCUkFTSUwsICBnZXN0b3JhICBkYSAgUmVkZSAgQklNICBlICBkbyAgUkktTUIsICBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGVzdGUgZGVww7NzaXRvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUvb3UgcHJlc2VydmHDp8Ojby5PICBTcihzKSAgZGVjbGFyYShtKSAgcXVlICBhICBhcHJlc2VudGHDp8OjbyAgZG8gIHNldSAgdHJhYmFsaG8gIMOpICBvcmlnaW5hbCAgZSAgcXVlICBvICBTcihzKSAgcG9kZShtKSAgY29uY2VkZXIgIG9zICBkaXJlaXRvcyAgY29udGlkb3MgIG5lc3RhICBsaWNlbsOnYS4gIE8gIFNyKHMpICB0YW1iw6ltICBkZWNsYXJhKG0pICBxdWUgIG8gIGVudmlvICDDqSAgZGUgIHNldSAgY29uaGVjaW1lbnRvICBlICBuw6NvICBpbmZyaW5nZSAgb3MgIGRpcmVpdG9zICBhdXRvcmFpcyAgZGUgIG91dHJhICBwZXNzb2EgIG91ICBpbnN0aXR1acOnw6NvLiAgQ2FzbyAgbyAgZG9jdW1lbnRvICBhICBzZXIgIGRlcG9zaXRhZG8gIGNvbnRlbmhhICBtYXRlcmlhbCAgcGFyYSAgbyAgcXVhbCAgbyAgU3IocykgIG7Do28gIGRldMOpbSAgYSAgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBkZSBhdXRvcmFpcywgbyBTcihzKSBkZWNsYXJhKG0pIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgY29uY2VkZXIgw6AgTUFSSU5IQSBETyBCUkFTSUwsIGdlc3RvcmEgZGEgUmVkZSBCSU0gZSBkbyBSSS1NQiwgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSBlIHF1ZSBvcyBtYXRlcmlhaXMgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zLCBlc3TDo28gZGV2aWRhbWVudGUgaWRlbnRpZmljYWRvcyBlIHJlY29uaGVjaWRvcyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZGEgYXByZXNlbnRhw6fDo28uIENBU08gIE8gIFRSQUJBTEhPICBERVBPU0lUQURPICBURU5IQSAgU0lETyAgRklOQU5DSUFETyAgT1UgIEFQT0lBRE8gIFBPUiAgVU0gIMOTUkfDg08sICBRVUUgIE7Dg08gIEEgIElOU1RJVFVJw4fDg08gIERFU1RFICBSRVNQT1NJVMOTUklPOiAgTyAgU1IgIERFQ0xBUkEgIFRFUiAgQ1VNUFJJRE8gVE9ET1MgT1MgRElSRUlUT1MgREUgUkVWSVPDg08gRSBRVUFJU1FVRVIgT1VUUkFTIE9CUklHQcOHw5VFUyBSRVFVRVJJREFTIFBFTE8gQ09OVFJBVE8gT1UgQUNPUkRPLk8gICAgU3IocykgICAgY29uY29yZGEobSkgICAgY29tICAgIGEgICAgTGljZW7Dp2EgICAgQ3JlYXRpdmUgICAgQ29tbW9ucyAgICBhZG90YWRhICAgIHBhcmEgICAgZXN0ZSAgICBSZXBvc2l0w7NyaW8gICAgSW5zdGl0dWNpb25hbCAgICBxdWUgICAgY29uY2VkZSAgICBvICAgIGRpcmVpdG8gICAgZGUgICAgQ09NUEFSVElMSEFSICAgIGUgICAgYXMgICAgcmVzdHJpw6fDtWVzICAgIGRlICAgIEFUUklCVUnDh8ODTywgICAgTsODTyAgICBDT01FUkNJQUxJWkHDh8ODTyAgICBFICAgIFNFTSAgICBERVJJVkHDh8OVRVMuQ09NUEFSVElMSEFSOiAgY29waWFyICBlICByZWRpc3RyaWJ1aXIgIG8gIG1hdGVyaWFsICBlbSAgcXVhbHF1ZXIgIHN1cG9ydGUgIG91ICBmb3JtYXRvICBlICBvICBsaWNlbmNpYW50ZSBuw6NvIHBvZGUgcmV2b2dhciBlc3RlcyBkaXJlaXRvcyBkZXNkZSBxdWUgbyBTcihzKSByZXNwZWl0ZShtKSBvcyB0ZXJtb3MgZGEgbGljZW7Dp2EuQVRSSUJVScOHw4NPOiAgbyAgU3IocykgIGRldmUobSkgIGRhciAgbyAgY3LDqWRpdG8gIGFwcm9wcmlhZG8sICBwcm92ZXIgIHVtICBsaW5rICBwYXJhICBhICBsaWNlbsOnYSAgZSAgaW5kaWNhciAgc2UgIG11ZGFuw6dhcyAgZm9yYW0gIGZlaXRhcy4gIE8gIFNyKHMpICBkZXZlKG0pICBmYXrDqi1sbyAgZW0gIHF1YWxxdWVyICBjaXJjdW5zdMOibmNpYSByYXpvw6F2ZWwsIG1hcyBkZSBtYW5laXJhIGFsZ3VtYSBxdWUgc3VnaXJhIGFvIGxpY2VuY2lhbnRlIGEgYXBvaWFyIG8gU3Iocykgb3UgbyBzZXUgdXNvLk7Dg08gQ09NRVJDSUFMOiBvIFNyKHMpIG7Do28gcG9kZShtKSB1c2FyIG8gbWF0ZXJpYWwgcGFyYSBmaW5zIGNvbWVyY2lhaXMuU0VNIERFUklWQcOHw5VFUzogc2UgbyBTcihzKSByZW1peGFyKGVtKSwgdHJhbnNmb3JtYXIoZW0pIG91IGNyaWFyKGVtKSBhIHBhcnRpciBkbyBtYXRlcmlhbCwgbyBTcihzKSBuw6NvIHBvZGUobSkgZGlzdHJpYnVpciBvIG1hdGVyaWFsIG1vZGlmaWNhZG8uU0VNIFJFU1RSScOHw5VFUyBBRElDSU9OQUlTOiBvIFNyKHMpIG7Do28gcG9kZShtKSBhcGxpY2FyIHRlcm1vcyBqdXLDrWRpY29zIG91IG1lZGlkYXMgZGUgY2Fyw6F0ZXIgdGVjbm9sw7NnaWNvIHF1ZSByZXN0cmluamFtIGxlZ2FsbWVudGUgb3V0cm9zIGRlIGZhemVyZW0gYWxnbyBxdWUgYSBsaWNlbsOnYSBwZXJtaXRhLkEgUmVkZSBCSU0gZSBvIFJJLU1CIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvIHNldShzKSBub21lKHMpIGNvbW8gYXV0b3IoZXMpIG91IHRpdHVsYXIoZXMpIGRvIGRpcmVpdG8gZGUgYXV0b3IoZXMpIGRvIGRvY3VtZW50byBzdWJtZXRpZG8gZSBkZWNsYXJhIHF1ZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Repositório InstitucionalPUBhttps://www.repositorio.mar.mil.br/oai/requestdphdm.repositorio@marinha.mil.bropendoar:2023-05-12T13:21:55Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB)false |
dc.title.pt_BR.fl_str_mv |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
title |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
spellingShingle |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos Vaqueiro, Ramon Dantas Compras públicas Mineração de texto Aprendizado de máquina Banco de dados |
title_short |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
title_full |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
title_fullStr |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
title_full_unstemmed |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
title_sort |
Machine Learning Aplicado em Dados Abertos Governamentais para Detecção de Impropriedades na Aplicação de Recursos Públicos |
author |
Vaqueiro, Ramon Dantas |
author_facet |
Vaqueiro, Ramon Dantas Escovedo, Tatiana |
author_role |
author |
author2 |
Escovedo, Tatiana |
author2_role |
author |
dc.contributor.author.fl_str_mv |
Vaqueiro, Ramon Dantas Escovedo, Tatiana |
dc.subject.por.fl_str_mv |
Compras públicas Mineração de texto Aprendizado de máquina |
topic |
Compras públicas Mineração de texto Aprendizado de máquina Banco de dados |
dc.subject.dgpm.pt_BR.fl_str_mv |
Banco de dados |
description |
O elevado poder de compra do Estado e a necessidade de se zelar pela correta aplicação dos recursos públicos suscita no cidadão grande preocupação.À luz dessa realidade, o legislador conferiu um tratamento diferenciado para as compras públicas e as submeteu a maiores níveis de transparência, determinando que seus dados passassem a ser disponibilizados abertamente. Em face da demanda popular e da disponibilidade de acesso a esse recurso, torna-se imperiosa as utilização pelos órgãos competentes.Todavia, parte significativa desses dados são textuais, ou seja, não estruturados, o que requer um diligente específico pré-processamento por parte de quem os utilize. Este artigo se debruça sobre uma base de dados correspondente aos materiais comprados pelo Governo Federal na modalidade pregão ao longo do ano de 2021.Objetivou-se agrupar as descrições textuais de compras semelhantes, permitindo sua comparação.Dentre as aplicações possíveis a partir do correto agrupamento, encontra-se a identificação de outliers nos preços das aquisições, sinalizando um indício de eventual impropriedade. Como resultado, obteve-se uma clusterização considerada satisfatória em 72% dos casos. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-10-21T12:12:30Z |
dc.date.available.fl_str_mv |
2022-10-21T12:12:30Z |
dc.date.issued.fl_str_mv |
2022 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.repositorio.mar.mil.br/handle/ripcmb/845541 |
url |
https://www.repositorio.mar.mil.br/handle/ripcmb/845541 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) instname:Marinha do Brasil (MB) instacron:MB |
instname_str |
Marinha do Brasil (MB) |
instacron_str |
MB |
institution |
MB |
reponame_str |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
collection |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) |
bitstream.url.fl_str_mv |
https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/2/TCC_CT_IM_VAQUEIRO.pdf https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/3/license.txt https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/4/TCC_CT_IM_VAQUEIRO.pdf.txt https://www.repositorio.mar.mil.br/bitstream/ripcmb/845541/5/TCC_CT_IM_VAQUEIRO.pdf.jpg |
bitstream.checksum.fl_str_mv |
25d601cb31861f11f0a0e9bd683418fb 8ff7ce654d5215cee2106f3e3b7eb37f 688ed4ef3e57f473d83e7a4506c73ac1 84fa6cd20565d5ecb82da8582049d7b3 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB) - Marinha do Brasil (MB) |
repository.mail.fl_str_mv |
dphdm.repositorio@marinha.mil.br |
_version_ |
1798310212404248576 |