Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural

Detalhes bibliográficos
Autor(a) principal: Silva, Felipe Morais da
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/46060
Resumo: No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos.
id UFRN_0046935e7710b0754c88057a56163913
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/46060
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Silva, Felipe Morais dahttp://lattes.cnpq.br/7243232425776112http://lattes.cnpq.br/4744754780165354Prolo, Carlos Augustohttp://lattes.cnpq.br/3828418008457501Magalhães, Ismênia Blavatsky dehttp://lattes.cnpq.br/7041359168937281Araújo, Daniel Sabino Amorim de2022-02-17T18:02:07Z2022-02-17T18:02:07Z2022-02-04SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/46060No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos.Over the years, the need to automate repetitive processes grew as new market demands emerged and, eventually, new technologies were developed in order to make this demand viable. Computing, in particular, is an area that was responsible for creating countless techniques capable of automating daily tasks and, nowadays, it is gaining even more space thanks to the advances made in recent years by Artificial Intelligence. Furthermore, there is a sub-area of Artificial Intelligence, which is Machine Learning, whose objective is to create models capable of representing a given problem in order to obtain answers to specific questions. Bringing this discussion to a real scenario, the Polícia Rodoviária Federal (PRF) of Rio Grande do Norte, among its various activities, needs to analyze a large amount of resources from fines in order to guarantee the citizen’s right to contest an eventual injustice in law enforcement. These fines can be submitted by completing physical or electronic documentation. Additionally, there is no standardization in the structure of the document, since both common people and legal professionals can produce this document. After the responsible agent analyzes the appeal, it is necessary to justify the approval or rejection regarding the document. In order to assist and expedite the analysis of fines resources, which is a repetitive and tiring process, the objective of this work arose in conjunction with the PRF of RN, which is to develop a system capable of, given a fine resource as input , process your content and provide a pre-opinion so that the reviewer can save a great deal of time writing the appeal justification. To develop this solution, PRF made available more than a thousand documents, which went through a text extraction and data pre-processing process. After that, it was planned to develop a processing pipeline to: (i) transform texts into numerical and/or vector representations; (ii) use numerical and/or vector representations to build intelligent models based on Machine Learning; (iii) evaluate and compare the results obtained from different techniques. The models were trained: Naive-Bayes and SVM using the Bag of Words (BOW) and Term Frequency–Inverse Document Frequency (TF-IDF) representations; Long Short-Term Memory (LSTM) with the Word2Vec representation. After implementing these models, they were evaluated in terms of accuracy, precision, recall and F-score metrics. It was noticed that the models with the best performance in relation to these metrics were, respectively, SVM with TFIDF and LSTM with Word2Vec. Finally, a REST API was developed to query these models.Universidade Federal do Rio Grande do NorteCiência da ComputaçãoUFRNBrasilInformática e Matemática AplicadaAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessRecurso de multaProcessamento de Linguagem NaturalAprendizado de MáquinaNatural Language ProcessingMachine LearningComputaçãoAppeal to contest fineAnálise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem NaturalAutomated analysis of traffic infraction appeal requests using Natural Language Processinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALAnáliseAutomatizada_Silva_2022.pdfAnáliseAutomatizada_Silva_2022.pdfDocumento final TCC com a ficha catalográficaapplication/pdf776211https://repositorio.ufrn.br/bitstream/123456789/46060/4/An%c3%a1liseAutomatizada_Silva_2022.pdf6577483ff93b785ab58b935b87073851MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/46060/5/license.txte9597aa2854d128fd968be5edc8a28d9MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufrn.br/bitstream/123456789/46060/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52123456789/460602022-08-19 09:08:34.811oai:https://repositorio.ufrn.br:123456789/46060Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-08-19T12:08:34Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
dc.title.alternative.pt_BR.fl_str_mv Automated analysis of traffic infraction appeal requests using Natural Language Processing
title Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
spellingShingle Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
Silva, Felipe Morais da
Recurso de multa
Processamento de Linguagem Natural
Aprendizado de Máquina
Natural Language Processing
Machine Learning
Computação
Appeal to contest fine
title_short Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_full Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_fullStr Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_full_unstemmed Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_sort Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
author Silva, Felipe Morais da
author_facet Silva, Felipe Morais da
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7243232425776112
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4744754780165354
dc.contributor.referees1.none.fl_str_mv Prolo, Carlos Augusto
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3828418008457501
dc.contributor.referees2.none.fl_str_mv Magalhães, Ismênia Blavatsky de
dc.contributor.referees2Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7041359168937281
dc.contributor.author.fl_str_mv Silva, Felipe Morais da
dc.contributor.advisor1.fl_str_mv Araújo, Daniel Sabino Amorim de
contributor_str_mv Araújo, Daniel Sabino Amorim de
dc.subject.por.fl_str_mv Recurso de multa
Processamento de Linguagem Natural
Aprendizado de Máquina
Natural Language Processing
Machine Learning
Computação
Appeal to contest fine
topic Recurso de multa
Processamento de Linguagem Natural
Aprendizado de Máquina
Natural Language Processing
Machine Learning
Computação
Appeal to contest fine
description No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-02-17T18:02:07Z
dc.date.available.fl_str_mv 2022-02-17T18:02:07Z
dc.date.issued.fl_str_mv 2022-02-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/46060
identifier_str_mv SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.
url https://repositorio.ufrn.br/handle/123456789/46060
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 3.0 Brazil
http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Informática e Matemática Aplicada
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/46060/4/An%c3%a1liseAutomatizada_Silva_2022.pdf
https://repositorio.ufrn.br/bitstream/123456789/46060/5/license.txt
https://repositorio.ufrn.br/bitstream/123456789/46060/2/license_rdf
bitstream.checksum.fl_str_mv 6577483ff93b785ab58b935b87073851
e9597aa2854d128fd968be5edc8a28d9
4d2950bda3d176f570a9f8b328dfbbef
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832623607873536