Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter

Detalhes bibliográficos
Autor(a) principal: Larissa Sayuri Futino Castro dos Santos
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/BUBD-9VDJH7
Resumo: Entender a dinâmica criminal é essencial para criação de políticas públicas mais adequadas para o controle dos diversos tipos de crimes. Neste estudo, procura-se mapear a ocorrência de crimes no estado de São Paulo através da coleta de postagens na rede social Twitter. A partir da informação dos dados coletados e através de métodos de aprendizado de máquina, o trabalho tem como objetivo classificar, de forma inteiramente automatizada, a ocorrência ou não de um evento de crime na região citada. Assim, pode-se visualizar aspectos espaço tempo da distribuição dos diversos tipos de crimes de maneira dinâmica, pois as coletas podem ser realizadas em tempo real. Nesse trabalho, apresentamos a forma empregada para coleta de tweets e os métodos de aprendizado de máquina para classificação dos tweets. Inicialmente, são utilizadas e apresentadas três técnicas de classificação de textos conhecidas como: Naive-Bayes, Árvore de Decisão e Máquinas de Vetores de Suporte (SVM). Um estudo de validação cruzada é realizado em cada uma das técnicas e essas são comparadas sob o ponto de vista da eficiência de classificação e tempo computacional.
id UFMG_13abf517a090bd4294088d73a6b392eb
oai_identifier_str oai:repositorio.ufmg.br:1843/BUBD-9VDJH7
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Marcos Oliveira PratesErica Castilho RodriguesErica Castilho RodriguesRenato Martins AssuncaoRafael IzbickiLarissa Sayuri Futino Castro dos Santos2019-08-14T17:04:27Z2019-08-14T17:04:27Z2015-02-11http://hdl.handle.net/1843/BUBD-9VDJH7Entender a dinâmica criminal é essencial para criação de políticas públicas mais adequadas para o controle dos diversos tipos de crimes. Neste estudo, procura-se mapear a ocorrência de crimes no estado de São Paulo através da coleta de postagens na rede social Twitter. A partir da informação dos dados coletados e através de métodos de aprendizado de máquina, o trabalho tem como objetivo classificar, de forma inteiramente automatizada, a ocorrência ou não de um evento de crime na região citada. Assim, pode-se visualizar aspectos espaço tempo da distribuição dos diversos tipos de crimes de maneira dinâmica, pois as coletas podem ser realizadas em tempo real. Nesse trabalho, apresentamos a forma empregada para coleta de tweets e os métodos de aprendizado de máquina para classificação dos tweets. Inicialmente, são utilizadas e apresentadas três técnicas de classificação de textos conhecidas como: Naive-Bayes, Árvore de Decisão e Máquinas de Vetores de Suporte (SVM). Um estudo de validação cruzada é realizado em cada uma das técnicas e essas são comparadas sob o ponto de vista da eficiência de classificação e tempo computacional.To understand crime dynamics is essential for the development of public politics to control many types os crimes. In this study, we aim to map the crime occurrences at the state of São Paulo by collecting posts from the Twitter Social Web. Using the coollected data and machine learning techniques this study aim to classify, in an automatic way, the occurrences of crimes in the cited area. This way, we are able to dinamically visualize space time aspects of the crime distribution due to the possibility of real time collection of data. In this work, we present how to collect tweets and the machine learning methodology for the tweet classification. At first, we present and use three text classification techniques, known as, Naive-Bayes, Decision Trees and Support Vector Machines (SVM). Next, a cross validation study is performed for each technique and they are compared by classification eficiency and computational time.Universidade Federal de Minas GeraisUFMGEstatísticaEstatística criminalTwitterMineração de dados (Computação)ProbabilidadesÁrvore de decisãoTwitterMineração de textoSVMNaive-BayesEstudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdissertacao_larissasayurifutino.pdfapplication/pdf4294301https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/1/dissertacao_larissasayurifutino.pdfa689948a35def261c30f414c707d81a0MD51TEXTdissertacao_larissasayurifutino.pdf.txtdissertacao_larissasayurifutino.pdf.txtExtracted texttext/plain169953https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/2/dissertacao_larissasayurifutino.pdf.txt5f560cac2400d0bd0f11a541a0a8b4daMD521843/BUBD-9VDJH72019-11-14 13:48:41.95oai:repositorio.ufmg.br:1843/BUBD-9VDJH7Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T16:48:41Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
title Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
spellingShingle Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
Larissa Sayuri Futino Castro dos Santos
Árvore de decisão
Twitter
Mineração de texto
SVM
Naive-Bayes
Estatística
Estatística criminal
Twitter
Mineração de dados (Computação)
Probabilidades
title_short Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
title_full Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
title_fullStr Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
title_full_unstemmed Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
title_sort Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
author Larissa Sayuri Futino Castro dos Santos
author_facet Larissa Sayuri Futino Castro dos Santos
author_role author
dc.contributor.advisor1.fl_str_mv Marcos Oliveira Prates
dc.contributor.advisor-co1.fl_str_mv Erica Castilho Rodrigues
dc.contributor.referee1.fl_str_mv Erica Castilho Rodrigues
dc.contributor.referee2.fl_str_mv Renato Martins Assuncao
dc.contributor.referee3.fl_str_mv Rafael Izbicki
dc.contributor.author.fl_str_mv Larissa Sayuri Futino Castro dos Santos
contributor_str_mv Marcos Oliveira Prates
Erica Castilho Rodrigues
Erica Castilho Rodrigues
Renato Martins Assuncao
Rafael Izbicki
dc.subject.por.fl_str_mv Árvore de decisão
Twitter
Mineração de texto
SVM
Naive-Bayes
topic Árvore de decisão
Twitter
Mineração de texto
SVM
Naive-Bayes
Estatística
Estatística criminal
Twitter
Mineração de dados (Computação)
Probabilidades
dc.subject.other.pt_BR.fl_str_mv Estatística
Estatística criminal
Twitter
Mineração de dados (Computação)
Probabilidades
description Entender a dinâmica criminal é essencial para criação de políticas públicas mais adequadas para o controle dos diversos tipos de crimes. Neste estudo, procura-se mapear a ocorrência de crimes no estado de São Paulo através da coleta de postagens na rede social Twitter. A partir da informação dos dados coletados e através de métodos de aprendizado de máquina, o trabalho tem como objetivo classificar, de forma inteiramente automatizada, a ocorrência ou não de um evento de crime na região citada. Assim, pode-se visualizar aspectos espaço tempo da distribuição dos diversos tipos de crimes de maneira dinâmica, pois as coletas podem ser realizadas em tempo real. Nesse trabalho, apresentamos a forma empregada para coleta de tweets e os métodos de aprendizado de máquina para classificação dos tweets. Inicialmente, são utilizadas e apresentadas três técnicas de classificação de textos conhecidas como: Naive-Bayes, Árvore de Decisão e Máquinas de Vetores de Suporte (SVM). Um estudo de validação cruzada é realizado em cada uma das técnicas e essas são comparadas sob o ponto de vista da eficiência de classificação e tempo computacional.
publishDate 2015
dc.date.issued.fl_str_mv 2015-02-11
dc.date.accessioned.fl_str_mv 2019-08-14T17:04:27Z
dc.date.available.fl_str_mv 2019-08-14T17:04:27Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUBD-9VDJH7
url http://hdl.handle.net/1843/BUBD-9VDJH7
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/1/dissertacao_larissasayurifutino.pdf
https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/2/dissertacao_larissasayurifutino.pdf.txt
bitstream.checksum.fl_str_mv a689948a35def261c30f414c707d81a0
5f560cac2400d0bd0f11a541a0a8b4da
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589210631831552