Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRN |
Texto Completo: | https://repositorio.ufrn.br/handle/123456789/45232 |
Resumo: | Em uma investigação criminal é comum o recolhimento de diversos dispositivos como celulares, notebooks, computadores, dentre outros aparelhos dos acusados como evidências para a investigação. O analista forense, profissional responsável pela análise dessas evidências, tem o trabalho de procurar indícios que incriminam ou inocentam o acusado. Muito desses indícios estão presentes em textos. No entanto, encontrar esses textos é um trabalho cansativo e demorado devido ao fato de um único aparelho celular conter milhares de mensagens e uma única investigação envolver dezenas de investigados com um ou vários dispositivos cada. Com o intuito de minimizar o esforço para encontrar mensagens suspeitas e consequentemente acelerar o trabalho feito pelo analista forense, este trabalho propõe a criação de uma Inteligência Artificial capaz de detectar e classificar mensagens relevantes para uma investigação criminal. Para tanto, alguns algoritmos de Machine Learning são inicialmente investigados, como Random Forest, Regressão Logística, Support Vector Machine (SVM) e a XGBoost, para a realização dessa tarefa. Devido a natureza do tipo de mensagem, este trabalho contou com o suporte e apoio do Ministério Público do Estado do Rio Grande do Norte (MPRN), o qual disponibilizou todos os dados, ferramentas e recursos computacionais necessárias para o desenvolvimento deste trabalho. Com a ajuda da instituição foi possível realizar a construção de bases de dados que representam os conjuntos de mensagens relevantes, e definir as classes de mensagem a que pertencem. Um Sistema Web foi desenvolvido e implantado no ambiente local do MPRN para que analistas e outros profissionais responsáveis pudessem classificar mensagens para a base de dados. |
id |
UFRN_4e6c5641435e2621faa2f1371e8ce1b0 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufrn.br:123456789/45232 |
network_acronym_str |
UFRN |
network_name_str |
Repositório Institucional da UFRN |
repository_id_str |
|
spelling |
Souza, Gabriel Araújo dehttp://lattes.cnpq.br/2590202875754763http://lattes.cnpq.br/4635320220484649Araújo, Daniel Sabino Amorim dehttp://lattes.cnpq.br/4744754780165354Lopes, Frederico Araújo da Silvahttp://lattes.cnpq.br/9177823996895375Cacho, Nélio Alessandro Azevedo2021-12-07T18:32:59Z2021-12-07T18:32:59Z2021-09-03SOUZA, Gabriel Araújo de. Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais. 2021. 81f. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) – Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/45232Em uma investigação criminal é comum o recolhimento de diversos dispositivos como celulares, notebooks, computadores, dentre outros aparelhos dos acusados como evidências para a investigação. O analista forense, profissional responsável pela análise dessas evidências, tem o trabalho de procurar indícios que incriminam ou inocentam o acusado. Muito desses indícios estão presentes em textos. No entanto, encontrar esses textos é um trabalho cansativo e demorado devido ao fato de um único aparelho celular conter milhares de mensagens e uma única investigação envolver dezenas de investigados com um ou vários dispositivos cada. Com o intuito de minimizar o esforço para encontrar mensagens suspeitas e consequentemente acelerar o trabalho feito pelo analista forense, este trabalho propõe a criação de uma Inteligência Artificial capaz de detectar e classificar mensagens relevantes para uma investigação criminal. Para tanto, alguns algoritmos de Machine Learning são inicialmente investigados, como Random Forest, Regressão Logística, Support Vector Machine (SVM) e a XGBoost, para a realização dessa tarefa. Devido a natureza do tipo de mensagem, este trabalho contou com o suporte e apoio do Ministério Público do Estado do Rio Grande do Norte (MPRN), o qual disponibilizou todos os dados, ferramentas e recursos computacionais necessárias para o desenvolvimento deste trabalho. Com a ajuda da instituição foi possível realizar a construção de bases de dados que representam os conjuntos de mensagens relevantes, e definir as classes de mensagem a que pertencem. Um Sistema Web foi desenvolvido e implantado no ambiente local do MPRN para que analistas e outros profissionais responsáveis pudessem classificar mensagens para a base de dados.In a criminal investigation, it is common to gather many devices such as smartphones, laptops, computers, and other devices belonging to suspects. The forensic analyst, the professional responsible for analyzing these evidences, has searched for clues that incriminate or innocent the accused. Many of these clues can be found in texts. However, finding these texts is a tired and slow process because a unique smartphone can contain thousands of messages, and in an individual investigation can contain tens or hundreds of smartphones. In order to minimize the effort to find the suspect and relevant text messages and consequently speed up and improve the forensic analyst job, this work proposes an Artificial Intelligence to detect and classify relevant text messages in the context of criminal investigations. Therefore, some Machine Learning algorithms are investigated to accomplish this task, such as Random Forest, Logistic Regression, Support Vector Machine (SVM), and XGBoost. Due to the context of these messages, this work is supported by Ministério Público do Estado do Rio Grande do Norte (MPRN), which provides all needed data, tools, and computational resources for the development of this work. The institution helps build the database to represent the set of relevant text messages and define the classes of messages represented by the set of relevant messages. A WEB System was developed to execute in the MPRN local environment to the analysts and other professionals mark and classify the data to the dataset.Ministério Público do Estado do Rio Grande do NorteFundação Norte-Rio-Grandense de Pesquisa e Cultura (FUNPEC)Universidade Federal do Rio Grande do NorteBacharelado em CIências da ComputaçãoUFRNBrasilDepartamento de Informática e Matemática AplicadaAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessInteligência ArtificialMachine LearningInvestigações CriminaisClassificação de TextoEvidências CriminaisCriminal InvestigationsText classifyCriminal EvidenceArtificial IntelligenceInteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminaisArtificial intelligence to detect and classify relevant text messages in criminal evidencesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://repositorio.ufrn.br/bitstream/123456789/45232/2/license_rdf9b85e4235558a2887c2be3998124b615MD52ORIGINALInteligenciaArtificial_Souza_2021.pdfInteligenciaArtificial_Souza_2021.pdfapplication/pdf2421383https://repositorio.ufrn.br/bitstream/123456789/45232/4/InteligenciaArtificial_Souza_2021.pdf6d0f1de4e3b8924c9baa4aafe00e3363MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-81484https://repositorio.ufrn.br/bitstream/123456789/45232/5/license.txte9597aa2854d128fd968be5edc8a28d9MD55123456789/452322021-12-07 15:32:59.598oai:https://repositorio.ufrn.br:123456789/45232Tk9OLUVYQ0xVU0lWRSBESVNUUklCVVRJT04gTElDRU5TRQoKCkJ5IHNpZ25pbmcgYW5kIGRlbGl2ZXJpbmcgdGhpcyBsaWNlbnNlLCBNci4gKGF1dGhvciBvciBjb3B5cmlnaHQgaG9sZGVyKToKCgphKSBHcmFudHMgdGhlIFVuaXZlcnNpZGFkZSBGZWRlcmFsIFJpbyBHcmFuZGUgZG8gTm9ydGUgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgb2YKcmVwcm9kdWNlLCBjb252ZXJ0IChhcyBkZWZpbmVkIGJlbG93KSwgY29tbXVuaWNhdGUgYW5kIC8gb3IKZGlzdHJpYnV0ZSB0aGUgZGVsaXZlcmVkIGRvY3VtZW50IChpbmNsdWRpbmcgYWJzdHJhY3QgLyBhYnN0cmFjdCkgaW4KZGlnaXRhbCBvciBwcmludGVkIGZvcm1hdCBhbmQgaW4gYW55IG1lZGl1bS4KCmIpIERlY2xhcmVzIHRoYXQgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBpdHMgb3JpZ2luYWwgd29yaywgYW5kIHRoYXQKeW91IGhhdmUgdGhlIHJpZ2h0IHRvIGdyYW50IHRoZSByaWdodHMgY29udGFpbmVkIGluIHRoaXMgbGljZW5zZS4gRGVjbGFyZXMKdGhhdCB0aGUgZGVsaXZlcnkgb2YgdGhlIGRvY3VtZW50IGRvZXMgbm90IGluZnJpbmdlLCBhcyBmYXIgYXMgaXQgaXMKdGhlIHJpZ2h0cyBvZiBhbnkgb3RoZXIgcGVyc29uIG9yIGVudGl0eS4KCmMpIElmIHRoZSBkb2N1bWVudCBkZWxpdmVyZWQgY29udGFpbnMgbWF0ZXJpYWwgd2hpY2ggZG9lcyBub3QKcmlnaHRzLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBvYnRhaW5lZCBhdXRob3JpemF0aW9uIGZyb20gdGhlIGhvbGRlciBvZiB0aGUKY29weXJpZ2h0IHRvIGdyYW50IHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCB0aGlzIG1hdGVyaWFsIHdob3NlIHJpZ2h0cyBhcmUgb2YKdGhpcmQgcGFydGllcyBpcyBjbGVhcmx5IGlkZW50aWZpZWQgYW5kIHJlY29nbml6ZWQgaW4gdGhlIHRleHQgb3IKY29udGVudCBvZiB0aGUgZG9jdW1lbnQgZGVsaXZlcmVkLgoKSWYgdGhlIGRvY3VtZW50IHN1Ym1pdHRlZCBpcyBiYXNlZCBvbiBmdW5kZWQgb3Igc3VwcG9ydGVkIHdvcmsKYnkgYW5vdGhlciBpbnN0aXR1dGlvbiBvdGhlciB0aGFuIHRoZSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gR3JhbmRlIGRvIE5vcnRlLCBkZWNsYXJlcyB0aGF0IGl0IGhhcyBmdWxmaWxsZWQgYW55IG9ibGlnYXRpb25zIHJlcXVpcmVkIGJ5IHRoZSByZXNwZWN0aXZlIGFncmVlbWVudCBvciBhZ3JlZW1lbnQuCgpUaGUgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZG8gUmlvIEdyYW5kZSBkbyBOb3J0ZSB3aWxsIGNsZWFybHkgaWRlbnRpZnkgaXRzIG5hbWUgKHMpIGFzIHRoZSBhdXRob3IgKHMpIG9yIGhvbGRlciAocykgb2YgdGhlIGRvY3VtZW50J3MgcmlnaHRzCmRlbGl2ZXJlZCwgYW5kIHdpbGwgbm90IG1ha2UgYW55IGNoYW5nZXMsIG90aGVyIHRoYW4gdGhvc2UgcGVybWl0dGVkIGJ5CnRoaXMgbGljZW5zZQo=Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2021-12-07T18:32:59Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
dc.title.pt_BR.fl_str_mv |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais |
dc.title.alternative.pt_BR.fl_str_mv |
Artificial intelligence to detect and classify relevant text messages in criminal evidences |
title |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais |
spellingShingle |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais Souza, Gabriel Araújo de Inteligência Artificial Machine Learning Investigações Criminais Classificação de Texto Evidências Criminais Criminal Investigations Text classify Criminal Evidence Artificial Intelligence |
title_short |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais |
title_full |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais |
title_fullStr |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais |
title_full_unstemmed |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais |
title_sort |
Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais |
author |
Souza, Gabriel Araújo de |
author_facet |
Souza, Gabriel Araújo de |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2590202875754763 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4635320220484649 |
dc.contributor.referees1.none.fl_str_mv |
Lopes, Frederico Araújo da Silva |
dc.contributor.referees1Lattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/9177823996895375 |
dc.contributor.author.fl_str_mv |
Souza, Gabriel Araújo de |
dc.contributor.advisor-co1.fl_str_mv |
Araújo, Daniel Sabino Amorim de |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/4744754780165354 |
dc.contributor.advisor1.fl_str_mv |
Cacho, Nélio Alessandro Azevedo |
contributor_str_mv |
Araújo, Daniel Sabino Amorim de Cacho, Nélio Alessandro Azevedo |
dc.subject.por.fl_str_mv |
Inteligência Artificial Machine Learning Investigações Criminais Classificação de Texto Evidências Criminais Criminal Investigations Text classify Criminal Evidence Artificial Intelligence |
topic |
Inteligência Artificial Machine Learning Investigações Criminais Classificação de Texto Evidências Criminais Criminal Investigations Text classify Criminal Evidence Artificial Intelligence |
description |
Em uma investigação criminal é comum o recolhimento de diversos dispositivos como celulares, notebooks, computadores, dentre outros aparelhos dos acusados como evidências para a investigação. O analista forense, profissional responsável pela análise dessas evidências, tem o trabalho de procurar indícios que incriminam ou inocentam o acusado. Muito desses indícios estão presentes em textos. No entanto, encontrar esses textos é um trabalho cansativo e demorado devido ao fato de um único aparelho celular conter milhares de mensagens e uma única investigação envolver dezenas de investigados com um ou vários dispositivos cada. Com o intuito de minimizar o esforço para encontrar mensagens suspeitas e consequentemente acelerar o trabalho feito pelo analista forense, este trabalho propõe a criação de uma Inteligência Artificial capaz de detectar e classificar mensagens relevantes para uma investigação criminal. Para tanto, alguns algoritmos de Machine Learning são inicialmente investigados, como Random Forest, Regressão Logística, Support Vector Machine (SVM) e a XGBoost, para a realização dessa tarefa. Devido a natureza do tipo de mensagem, este trabalho contou com o suporte e apoio do Ministério Público do Estado do Rio Grande do Norte (MPRN), o qual disponibilizou todos os dados, ferramentas e recursos computacionais necessárias para o desenvolvimento deste trabalho. Com a ajuda da instituição foi possível realizar a construção de bases de dados que representam os conjuntos de mensagens relevantes, e definir as classes de mensagem a que pertencem. Um Sistema Web foi desenvolvido e implantado no ambiente local do MPRN para que analistas e outros profissionais responsáveis pudessem classificar mensagens para a base de dados. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-12-07T18:32:59Z |
dc.date.available.fl_str_mv |
2021-12-07T18:32:59Z |
dc.date.issued.fl_str_mv |
2021-09-03 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SOUZA, Gabriel Araújo de. Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais. 2021. 81f. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) – Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2021. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufrn.br/handle/123456789/45232 |
identifier_str_mv |
SOUZA, Gabriel Araújo de. Inteligência Artificial para a detecção e classificação de mensagens de texto relevantes em evidências criminais. 2021. 81f. Trabalho de Conclusão de Curso (Graduação em Ciências da Computação) – Departamento de Informática e Matemática Aplicada, Universidade Federal do Rio Grande do Norte, Natal, 2021. |
url |
https://repositorio.ufrn.br/handle/123456789/45232 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.publisher.program.fl_str_mv |
Bacharelado em CIências da Computação |
dc.publisher.initials.fl_str_mv |
UFRN |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento de Informática e Matemática Aplicada |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
instacron_str |
UFRN |
institution |
UFRN |
reponame_str |
Repositório Institucional da UFRN |
collection |
Repositório Institucional da UFRN |
bitstream.url.fl_str_mv |
https://repositorio.ufrn.br/bitstream/123456789/45232/2/license_rdf https://repositorio.ufrn.br/bitstream/123456789/45232/4/InteligenciaArtificial_Souza_2021.pdf https://repositorio.ufrn.br/bitstream/123456789/45232/5/license.txt |
bitstream.checksum.fl_str_mv |
9b85e4235558a2887c2be3998124b615 6d0f1de4e3b8924c9baa4aafe00e3363 e9597aa2854d128fd968be5edc8a28d9 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
repository.mail.fl_str_mv |
|
_version_ |
1814832825018351616 |