Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/46060 |
Resumo: | No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos. |
id |
UFRN_0046935e7710b0754c88057a56163913 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/46060 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Silva, Felipe Morais dahttp://lattes.cnpq.br/7243232425776112http://lattes.cnpq.br/4744754780165354Prolo, Carlos Augustohttp://lattes.cnpq.br/3828418008457501Magalhães, Ismênia Blavatsky dehttp://lattes.cnpq.br/7041359168937281Araújo, Daniel Sabino Amorim de2022-02-17T18:02:07Z2022-02-17T18:02:07Z2022-02-04SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/46060No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos.Over the years, the need to automate repetitive processes grew as new market demands emerged and, eventually, new technologies were developed in order to make this demand viable. Computing, in particular, is an area that was responsible for creating countless techniques capable of automating daily tasks and, nowadays, it is gaining even more space thanks to the advances made in recent years by Artificial Intelligence. Furthermore, there is a sub-area of Artificial Intelligence, which is Machine Learning, whose objective is to create models capable of representing a given problem in order to obtain answers to specific questions. Bringing this discussion to a real scenario, the Polícia Rodoviária Federal (PRF) of Rio Grande do Norte, among its various activities, needs to analyze a large amount of resources from fines in order to guarantee the citizen’s right to contest an eventual injustice in law enforcement. These fines can be submitted by completing physical or electronic documentation. Additionally, there is no standardization in the structure of the document, since both common people and legal professionals can produce this document. After the responsible agent analyzes the appeal, it is necessary to justify the approval or rejection regarding the document. In order to assist and expedite the analysis of fines resources, which is a repetitive and tiring process, the objective of this work arose in conjunction with the PRF of RN, which is to develop a system capable of, given a fine resource as input , process your content and provide a pre-opinion so that the reviewer can save a great deal of time writing the appeal justification. To develop this solution, PRF made available more than a thousand documents, which went through a text extraction and data pre-processing process. After that, it was planned to develop a processing pipeline to: (i) transform texts into numerical and/or vector representations; (ii) use numerical and/or vector representations to build intelligent models based on Machine Learning; (iii) evaluate and compare the results obtained from different techniques. The models were trained: Naive-Bayes and SVM using the Bag of Words (BOW) and Term Frequency–Inverse Document Frequency (TF-IDF) representations; Long Short-Term Memory (LSTM) with the Word2Vec representation. After implementing these models, they were evaluated in terms of accuracy, precision, recall and F-score metrics. It was noticed that the models with the best performance in relation to these metrics were, respectively, SVM with TFIDF and LSTM with Word2Vec. Finally, a REST API was developed to query these models.Universidade Federal do Rio Grande do NorteCiência da ComputaçãoUFRNBrasilInformática e Matemática AplicadaAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessRecurso de multaProcessamento de Linguagem NaturalAprendizado de MáquinaNatural Language ProcessingMachine LearningComputaçãoAppeal to contest fineAnálise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem NaturalAutomated analysis of traffic infraction appeal requests using Natural Language Processinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALAnáliseAutomatizada_Silva_2022.pdfAnáliseAutomatizada_Silva_2022.pdfDocumento final TCC com a ficha catalográficaapplication/pdf776211https://repositorio.ufrn.br/bitstream/123456789/46060/4/An%c3%a1liseAutomatizada_Silva_2022.pdf6577483ff93b785ab58b935b87073851MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/46060/5/license.txte9597aa2854d128fd968be5edc8a28d9MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufrn.br/bitstream/123456789/46060/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52123456789/460602022-08-19 09:08:34.811oai:https://repositorio.ufrn.br:123456789/46060Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-08-19T12:08:34Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural |
dc.title.alternative.pt_BR.fl_str_mv |
Automated analysis of traffic infraction appeal requests using Natural Language Processing |
title |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural |
spellingShingle |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural Silva, Felipe Morais da Recurso de multa Processamento de Linguagem Natural Aprendizado de Máquina Natural Language Processing Machine Learning Computação Appeal to contest fine |
title_short |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural |
title_full |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural |
title_fullStr |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural |
title_full_unstemmed |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural |
title_sort |
Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural |
author |
Silva, Felipe Morais da |
author_facet |
Silva, Felipe Morais da |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7243232425776112 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4744754780165354 |
dc.contributor.referees1.none.fl_str_mv |
Prolo, Carlos Augusto |
dc.contributor.referees1Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3828418008457501 |
dc.contributor.referees2.none.fl_str_mv |
Magalhães, Ismênia Blavatsky de |
dc.contributor.referees2Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/7041359168937281 |
dc.contributor.author.fl_str_mv |
Silva, Felipe Morais da |
dc.contributor.advisor1.fl_str_mv |
Araújo, Daniel Sabino Amorim de |
contributor_str_mv |
Araújo, Daniel Sabino Amorim de |
dc.subject.por.fl_str_mv |
Recurso de multa Processamento de Linguagem Natural Aprendizado de Máquina Natural Language Processing Machine Learning Computação Appeal to contest fine |
topic |
Recurso de multa Processamento de Linguagem Natural Aprendizado de Máquina Natural Language Processing Machine Learning Computação Appeal to contest fine |
description |
No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos. |
publishDate |
2022 |
dc.date.accessioned.fl_str_mv |
2022-02-17T18:02:07Z |
dc.date.available.fl_str_mv |
2022-02-17T18:02:07Z |
dc.date.issued.fl_str_mv |
2022-02-04 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/46060 |
identifier_str_mv |
SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022. |
url |
https://repositorio.ufrn.br/handle/123456789/46060 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Informática e Matemática Aplicada |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/46060/4/An%c3%a1liseAutomatizada_Silva_2022.pdf https://repositorio.ufrn.br/bitstream/123456789/46060/5/license.txt https://repositorio.ufrn.br/bitstream/123456789/46060/2/license_rdf |
bitstream.checksum.fl_str_mv |
6577483ff93b785ab58b935b87073851 e9597aa2854d128fd968be5edc8a28d9 4d2950bda3d176f570a9f8b328dfbbef |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832623607873536 |