Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural

Silva, Felipe Morais da

Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural

Detalhes bibliográficos
Autor(a) principal:	Silva, Felipe Morais da
Data de Publicação:	2022
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFRN
Texto Completo:	https://repositorio.ufrn.br/handle/123456789/46060
Resumo:	No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos.

Metadados do item

id	UFRN_0046935e7710b0754c88057a56163913
oai_identifier_str	oai:https://repositorio.ufrn.br:123456789/46060
network_acronym_str	UFRN
network_name_str	Repositório Institucional da UFRN
repository_id_str
spelling	Silva, Felipe Morais dahttp://lattes.cnpq.br/7243232425776112http://lattes.cnpq.br/4744754780165354Prolo, Carlos Augustohttp://lattes.cnpq.br/3828418008457501Magalhães, Ismênia Blavatsky dehttp://lattes.cnpq.br/7041359168937281Araújo, Daniel Sabino Amorim de2022-02-17T18:02:07Z2022-02-17T18:02:07Z2022-02-04SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.https://repositorio.ufrn.br/handle/123456789/46060No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos.Over the years, the need to automate repetitive processes grew as new market demands emerged and, eventually, new technologies were developed in order to make this demand viable. Computing, in particular, is an area that was responsible for creating countless techniques capable of automating daily tasks and, nowadays, it is gaining even more space thanks to the advances made in recent years by Artificial Intelligence. Furthermore, there is a sub-area of Artificial Intelligence, which is Machine Learning, whose objective is to create models capable of representing a given problem in order to obtain answers to specific questions. Bringing this discussion to a real scenario, the Polícia Rodoviária Federal (PRF) of Rio Grande do Norte, among its various activities, needs to analyze a large amount of resources from fines in order to guarantee the citizen’s right to contest an eventual injustice in law enforcement. These fines can be submitted by completing physical or electronic documentation. Additionally, there is no standardization in the structure of the document, since both common people and legal professionals can produce this document. After the responsible agent analyzes the appeal, it is necessary to justify the approval or rejection regarding the document. In order to assist and expedite the analysis of fines resources, which is a repetitive and tiring process, the objective of this work arose in conjunction with the PRF of RN, which is to develop a system capable of, given a fine resource as input , process your content and provide a pre-opinion so that the reviewer can save a great deal of time writing the appeal justification. To develop this solution, PRF made available more than a thousand documents, which went through a text extraction and data pre-processing process. After that, it was planned to develop a processing pipeline to: (i) transform texts into numerical and/or vector representations; (ii) use numerical and/or vector representations to build intelligent models based on Machine Learning; (iii) evaluate and compare the results obtained from different techniques. The models were trained: Naive-Bayes and SVM using the Bag of Words (BOW) and Term Frequency–Inverse Document Frequency (TF-IDF) representations; Long Short-Term Memory (LSTM) with the Word2Vec representation. After implementing these models, they were evaluated in terms of accuracy, precision, recall and F-score metrics. It was noticed that the models with the best performance in relation to these metrics were, respectively, SVM with TFIDF and LSTM with Word2Vec. Finally, a REST API was developed to query these models.Universidade Federal do Rio Grande do NorteCiência da ComputaçãoUFRNBrasilInformática e Matemática AplicadaAttribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessRecurso de multaProcessamento de Linguagem NaturalAprendizado de MáquinaNatural Language ProcessingMachine LearningComputaçãoAppeal to contest fineAnálise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem NaturalAutomated analysis of traffic infraction appeal requests using Natural Language Processinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNORIGINALAnáliseAutomatizada_Silva_2022.pdfAnáliseAutomatizada_Silva_2022.pdfDocumento final TCC com a ficha catalográficaapplication/pdf776211https://repositorio.ufrn.br/bitstream/123456789/46060/4/An%c3%a1liseAutomatizada_Silva_2022.pdf6577483ff93b785ab58b935b87073851MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/46060/5/license.txte9597aa2854d128fd968be5edc8a28d9MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ufrn.br/bitstream/123456789/46060/2/license_rdf4d2950bda3d176f570a9f8b328dfbbefMD52123456789/460602022-08-19 09:08:34.811oai:https://repositorio.ufrn.br:123456789/46060Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2022-08-19T12:08:34Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
dc.title.alternative.pt_BR.fl_str_mv	Automated analysis of traffic infraction appeal requests using Natural Language Processing
title	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
spellingShingle	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural Silva, Felipe Morais da Recurso de multa Processamento de Linguagem Natural Aprendizado de Máquina Natural Language Processing Machine Learning Computação Appeal to contest fine
title_short	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_full	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_fullStr	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_full_unstemmed	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
title_sort	Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural
author	Silva, Felipe Morais da
author_facet	Silva, Felipe Morais da
author_role	author
dc.contributor.authorLattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/7243232425776112
dc.contributor.advisorLattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/4744754780165354
dc.contributor.referees1.none.fl_str_mv	Prolo, Carlos Augusto
dc.contributor.referees1Lattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/3828418008457501
dc.contributor.referees2.none.fl_str_mv	Magalhães, Ismênia Blavatsky de
dc.contributor.referees2Lattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/7041359168937281
dc.contributor.author.fl_str_mv	Silva, Felipe Morais da
dc.contributor.advisor1.fl_str_mv	Araújo, Daniel Sabino Amorim de
contributor_str_mv	Araújo, Daniel Sabino Amorim de
dc.subject.por.fl_str_mv	Recurso de multa Processamento de Linguagem Natural Aprendizado de Máquina Natural Language Processing Machine Learning Computação Appeal to contest fine
topic	Recurso de multa Processamento de Linguagem Natural Aprendizado de Máquina Natural Language Processing Machine Learning Computação Appeal to contest fine
description	No decorrer dos anos, a necessidade de automatizar processos repetitivos cresceu à medida que novas demandas de mercado surgiram e, eventualmente, novas tecnologias foram desenvolvidas com o intuito de viabilizar essa demanda. A computação, em particular, é uma área que foi responsável por criar inúmeras técnicas capazes de automatizar tarefas do nosso cotidiano e, hoje em dia, está ganhando mais espaço ainda graças aos avanços obtidos nos últimos anos pela Inteligência Artificial. Além disso, existe uma subárea da Inteligência Artificial, que é o Aprendizado de Máquina, cujo objetivo é criar modelos capazes de representar um determinado problema com o intuito de obter respostas a perguntas específicas. Trazendo essa discussão para um cenário real, a Polícia Rodoviária Federal (PRF) do Rio Grande do Norte, dentre suas diversas atividades, precisa analisar uma grande quantidade de recursos de multas com o objetivo de garantir o direito que o cidadão tem de contestar uma eventual injustiça na aplicação da lei. Esses recursos de multa podem ser submetidos por meio do preenchimento de uma documentação física ou eletrônica. Adicionalmente, não há uma padronização na estrutura do documento, uma vez que tanto pessoas comuns quanto profissionais do direito podem produzir esse documento. Após o agente responsável analisar o recurso, é necessário justificar o deferimento ou indeferimento referente ao documento. Com o intuito de auxiliar e agilizar a análise dos recursos de multas, que é um processo repetitivo e cansativo, surgiu o objetivo deste trabalho em conjunto com a PRF do RN, que é desenvolver um sistema capaz de, dado um recurso de multa como entrada, processar seu conteúdo e fornecer um pré-parecer para que o agente responsável pela análise poupe uma grande quantidade de tempo redigindo a justificativa do recurso. Para desenvolver essa solução, a PRF disponibilizou mais de mil documentos, que passaram por um processo de extração de texto e pré-processamento de dados. Após isso, planejou-se desenvolver uma pipeline de processamento para: (i) transformar os textos em representações numéricas e/ou vetoriais; (ii) utilizar as representações numéricas e/ou vetoriais para construir modelos inteligentes com base em Aprendizado de Máquina; (iii) avaliar e comparar os resultados obtidos a partir de técnicas diferentes. Foram treinados os modelos: Naive-Bayes e SVM utilizando as representações Bag of Words (BOW) e Term Frequency–Inverse Document Frequency (TF-IDF); Long ShortTerm Memory (LSTM) com a representação Word2Vec. Após a implementação destes modelos, eles foram avaliados em relação as métricas acurácia, precisão, recall e F-score. Percebeu-se que os modelos com a melhor performance em relação a essas métricas foram, respectivamente, SVM com TF-IDF e LSTM com Word2Vec. Por fim, foi desenvolvida uma API REST para realizar consultas a esses modelos.
publishDate	2022
dc.date.accessioned.fl_str_mv	2022-02-17T18:02:07Z
dc.date.available.fl_str_mv	2022-02-17T18:02:07Z
dc.date.issued.fl_str_mv	2022-02-04
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.
dc.identifier.uri.fl_str_mv	https://repositorio.ufrn.br/handle/123456789/46060
identifier_str_mv	SILVA, Felipe Morais da. Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural. 2022. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) – Departamento de Informática e Matemática Aplicada, Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.
url	https://repositorio.ufrn.br/handle/123456789/46060
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv	Ciência da Computação
dc.publisher.initials.fl_str_mv	UFRN
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Informática e Matemática Aplicada
publisher.none.fl_str_mv	Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN
instname_str	Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str	UFRN
institution	UFRN
reponame_str	Repositório Institucional da UFRN
collection	Repositório Institucional da UFRN
bitstream.url.fl_str_mv	https://repositorio.ufrn.br/bitstream/123456789/46060/4/An%c3%a1liseAutomatizada_Silva_2022.pdf https://repositorio.ufrn.br/bitstream/123456789/46060/5/license.txt https://repositorio.ufrn.br/bitstream/123456789/46060/2/license_rdf
bitstream.checksum.fl_str_mv	6577483ff93b785ab58b935b87073851 e9597aa2854d128fd968be5edc8a28d9 4d2950bda3d176f570a9f8b328dfbbef
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_	1814832623607873536

Análise automatizada de pedidos de recurso a infrações de trânsito utilizando Processamento de Linguagem Natural

Registros relacionados