Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais

Detalhes bibliográficos
Autor(a) principal: Souza, Gabriel Araújo de
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFRN
Texto Completo: https://repositorio.ufrn.br/handle/123456789/45232
Resumo: Em uma investigação criminal é comum o recolhimento de diversos dispositivos como celulares, notebooks, computadores, dentre outros aparelhos dos acusados como evidências para a investigação. O analista forense, profissional responsável pela análise dessas evidências, tem o trabalho de procurar indícios que incriminam ou inocentam o acusado. Muito desses indícios estão presentes em textos. No entanto, encontrar esses textos é um trabalho cansativo e demorado devido ao fato de um único aparelho celular conter milhares de mensagens e uma única investigação envolver dezenas de investigados com um ou vários dispositivos cada. Com o intuito de minimizar o esforço para encontrar mensagens suspeitas e consequentemente acelerar o trabalho feito pelo analista forense, este trabalho propõe a criação de uma Inteligência Artificial capaz de detectar e classificar mensagens relevantes para uma investigação criminal. Para tanto, alguns algoritmos de Machine Learning são inicialmente investigados, como Random Forest, Regressão Logística, Support Vector Machine (SVM) e a XGBoost, para a realização dessa tarefa. Devido a natureza do tipo de mensagem, este trabalho contou com o suporte e apoio do Ministério Público do Estado do Rio Grande do Norte (MPRN), o qual disponibilizou todos os dados, ferramentas e recursos computacionais necessárias para o desenvolvimento deste trabalho. Com a ajuda da instituição foi possível realizar a construção de bases de dados que representam os conjuntos de mensagens relevantes, e definir as classes de mensagem a que pertencem. Um Sistema Web foi desenvolvido e implantado no ambiente local do MPRN para que analistas e outros profissionais responsáveis pudessem classificar mensagens para a base de dados.
id UFRN_4e6c5641435e2621faa2f1371e8ce1b0
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/45232
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Souza, Gabriel Araújo dehttp://lattes.cnpq.br/2590202875754763http://lattes.cnpq.br/4635320220484649Araújo, Daniel Sabino Amorim dehttp://lattes.cnpq.br/4744754780165354Lopes, Frederico Araújo da Silvahttp://lattes.cnpq.br/9177823996895375Cacho, Nélio Alessandro Azevedo2021-12-07T18:32:59Z2021-12-07T18:32:59Z2021-09-03SOUZA, Gabriel Araújo de. Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais. 2021. 81f. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) – Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/45232Em uma investigação criminal é comum o recolhimento de diversos dispositivos como celulares, notebooks, computadores, dentre outros aparelhos dos acusados como evidências para a investigação. O analista forense, profissional responsável pela análise dessas evidências, tem o trabalho de procurar indícios que incriminam ou inocentam o acusado. Muito desses indícios estão presentes em textos. No entanto, encontrar esses textos é um trabalho cansativo e demorado devido ao fato de um único aparelho celular conter milhares de mensagens e uma única investigação envolver dezenas de investigados com um ou vários dispositivos cada. Com o intuito de minimizar o esforço para encontrar mensagens suspeitas e consequentemente acelerar o trabalho feito pelo analista forense, este trabalho propõe a criação de uma Inteligência Artificial capaz de detectar e classificar mensagens relevantes para uma investigação criminal. Para tanto, alguns algoritmos de Machine Learning são inicialmente investigados, como Random Forest, Regressão Logística, Support Vector Machine (SVM) e a XGBoost, para a realização dessa tarefa. Devido a natureza do tipo de mensagem, este trabalho contou com o suporte e apoio do Ministério Público do Estado do Rio Grande do Norte (MPRN), o qual disponibilizou todos os dados, ferramentas e recursos computacionais necessárias para o desenvolvimento deste trabalho. Com a ajuda da instituição foi possível realizar a construção de bases de dados que representam os conjuntos de mensagens relevantes, e definir as classes de mensagem a que pertencem. Um Sistema Web foi desenvolvido e implantado no ambiente local do MPRN para que analistas e outros profissionais responsáveis pudessem classificar mensagens para a base de dados.In a criminal investigation, it is common to gather many devices such as smartphones, laptops, computers, and other devices belonging to suspects. The forensic analyst, the professional responsible for analyzing these evidences, has searched for clues that incriminate or innocent the accused. Many of these clues can be found in texts. However, finding these texts is a tired and slow process because a unique smartphone can contain thousands of messages, and in an individual investigation can contain tens or hundreds of smartphones. In order to minimize the effort to find the suspect and relevant text messages and consequently speed up and improve the forensic analyst job, this work proposes an Artificial Intelligence to detect and classify relevant text messages in the context of criminal investigations. Therefore, some Machine Learning algorithms are investigated to accomplish this task, such as Random Forest, Logistic Regression, Support Vector Machine (SVM), and XGBoost. Due to the context of these messages, this work is supported by Ministério Público do Estado do Rio Grande do Norte (MPRN), which provides all needed data, tools, and computational resources for the development of this work. The institution helps build the database to represent the set of relevant text messages and define the classes of messages represented by the set of relevant messages. A WEB System was developed to execute in the MPRN local environment to the analysts and other professionals mark and classify the data to the dataset.Ministério Público do Estado do Rio Grande do NorteFundação Norte-Rio-Grandense de Pesquisa e Cultura (FUNPEC)Universidade Federal do Rio Grande do NorteBacharelado em CIências da ComputaçãoUFRNBrasilDepartamento de Informática e Matemática AplicadaAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessInteligência ArtificialMachine LearningInvestigações CriminaisClassificação de TextoEvidências CriminaisCriminal InvestigationsText classifyCriminal EvidenceArtificial IntelligenceInteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminaisArtificial intelligence to detect and classify relevant text messages in criminal evidencesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.ufrn.br/bitstream/123456789/45232/2/license_rdf9b85e4235558a2887c2be3998124b615MD52ORIGINALInteligenciaArtificial_Souza_2021.pdfInteligenciaArtificial_Souza_2021.pdfapplication/pdf2421383https://repositorio.ufrn.br/bitstream/123456789/45232/4/InteligenciaArtificial_Souza_2021.pdf6d0f1de4e3b8924c9baa4aafe00e3363MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/45232/5/license.txte9597aa2854d128fd968be5edc8a28d9MD55123456789/452322021-12-07 15:32:59.598oai:https://repositorio.ufrn.br:123456789/45232Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-12-07T18:32:59Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
dc.title.alternative.pt_BR.fl_str_mv Artificial intelligence to detect and classify relevant text messages in criminal evidences
title Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
spellingShingle Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
Souza, Gabriel Araújo de
Inteligência Artificial
Machine Learning
Investigações Criminais
Classificação de Texto
Evidências Criminais
Criminal Investigations
Text classify
Criminal Evidence
Artificial Intelligence
title_short Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
title_full Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
title_fullStr Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
title_full_unstemmed Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
title_sort Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
author Souza, Gabriel Araújo de
author_facet Souza, Gabriel Araújo de
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2590202875754763
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4635320220484649
dc.contributor.referees1.none.fl_str_mv Lopes, Frederico Araújo da Silva
dc.contributor.referees1Lattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9177823996895375
dc.contributor.author.fl_str_mv Souza, Gabriel Araújo de
dc.contributor.advisor-co1.fl_str_mv Araújo, Daniel Sabino Amorim de
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/4744754780165354
dc.contributor.advisor1.fl_str_mv Cacho, Nélio Alessandro Azevedo
contributor_str_mv Araújo, Daniel Sabino Amorim de
Cacho, Nélio Alessandro Azevedo
dc.subject.por.fl_str_mv Inteligência Artificial
Machine Learning
Investigações Criminais
Classificação de Texto
Evidências Criminais
Criminal Investigations
Text classify
Criminal Evidence
Artificial Intelligence
topic Inteligência Artificial
Machine Learning
Investigações Criminais
Classificação de Texto
Evidências Criminais
Criminal Investigations
Text classify
Criminal Evidence
Artificial Intelligence
description Em uma investigação criminal é comum o recolhimento de diversos dispositivos como celulares, notebooks, computadores, dentre outros aparelhos dos acusados como evidências para a investigação. O analista forense, profissional responsável pela análise dessas evidências, tem o trabalho de procurar indícios que incriminam ou inocentam o acusado. Muito desses indícios estão presentes em textos. No entanto, encontrar esses textos é um trabalho cansativo e demorado devido ao fato de um único aparelho celular conter milhares de mensagens e uma única investigação envolver dezenas de investigados com um ou vários dispositivos cada. Com o intuito de minimizar o esforço para encontrar mensagens suspeitas e consequentemente acelerar o trabalho feito pelo analista forense, este trabalho propõe a criação de uma Inteligência Artificial capaz de detectar e classificar mensagens relevantes para uma investigação criminal. Para tanto, alguns algoritmos de Machine Learning são inicialmente investigados, como Random Forest, Regressão Logística, Support Vector Machine (SVM) e a XGBoost, para a realização dessa tarefa. Devido a natureza do tipo de mensagem, este trabalho contou com o suporte e apoio do Ministério Público do Estado do Rio Grande do Norte (MPRN), o qual disponibilizou todos os dados, ferramentas e recursos computacionais necessárias para o desenvolvimento deste trabalho. Com a ajuda da instituição foi possível realizar a construção de bases de dados que representam os conjuntos de mensagens relevantes, e definir as classes de mensagem a que pertencem. Um Sistema Web foi desenvolvido e implantado no ambiente local do MPRN para que analistas e outros profissionais responsáveis pudessem classificar mensagens para a base de dados.
publishDate 2021
dc.date.accessioned.fl_str_mv 2021-12-07T18:32:59Z
dc.date.available.fl_str_mv 2021-12-07T18:32:59Z
dc.date.issued.fl_str_mv 2021-09-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUZA, Gabriel Araújo de. Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais. 2021. 81f. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) – Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2021.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/handle/123456789/45232
identifier_str_mv SOUZA, Gabriel Araújo de. Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais. 2021. 81f. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) – Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/45232
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.publisher.program.fl_str_mv Bacharelado em CIências da Computação
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento de Informática e Matemática Aplicada
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/45232/2/license_rdf
https://repositorio.ufrn.br/bitstream/123456789/45232/4/InteligenciaArtificial_Souza_2021.pdf
https://repositorio.ufrn.br/bitstream/123456789/45232/5/license.txt
bitstream.checksum.fl_str_mv 9b85e4235558a2887c2be3998124b615
6d0f1de4e3b8924c9baa4aafe00e3363
e9597aa2854d128fd968be5edc8a28d9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1814832825018351616