Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/BUBD-9VDJH7 |
Resumo: | Entender a dinâmica criminal é essencial para criação de políticas públicas mais adequadas para o controle dos diversos tipos de crimes. Neste estudo, procura-se mapear a ocorrência de crimes no estado de São Paulo através da coleta de postagens na rede social Twitter. A partir da informação dos dados coletados e através de métodos de aprendizado de máquina, o trabalho tem como objetivo classificar, de forma inteiramente automatizada, a ocorrência ou não de um evento de crime na região citada. Assim, pode-se visualizar aspectos espaço tempo da distribuição dos diversos tipos de crimes de maneira dinâmica, pois as coletas podem ser realizadas em tempo real. Nesse trabalho, apresentamos a forma empregada para coleta de tweets e os métodos de aprendizado de máquina para classificação dos tweets. Inicialmente, são utilizadas e apresentadas três técnicas de classificação de textos conhecidas como: Naive-Bayes, Árvore de Decisão e Máquinas de Vetores de Suporte (SVM). Um estudo de validação cruzada é realizado em cada uma das técnicas e essas são comparadas sob o ponto de vista da eficiência de classificação e tempo computacional. |
id |
UFMG_13abf517a090bd4294088d73a6b392eb |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/BUBD-9VDJH7 |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Marcos Oliveira PratesErica Castilho RodriguesErica Castilho RodriguesRenato Martins AssuncaoRafael IzbickiLarissa Sayuri Futino Castro dos Santos2019-08-14T17:04:27Z2019-08-14T17:04:27Z2015-02-11http://hdl.handle.net/1843/BUBD-9VDJH7Entender a dinâmica criminal é essencial para criação de políticas públicas mais adequadas para o controle dos diversos tipos de crimes. Neste estudo, procura-se mapear a ocorrência de crimes no estado de São Paulo através da coleta de postagens na rede social Twitter. A partir da informação dos dados coletados e através de métodos de aprendizado de máquina, o trabalho tem como objetivo classificar, de forma inteiramente automatizada, a ocorrência ou não de um evento de crime na região citada. Assim, pode-se visualizar aspectos espaço tempo da distribuição dos diversos tipos de crimes de maneira dinâmica, pois as coletas podem ser realizadas em tempo real. Nesse trabalho, apresentamos a forma empregada para coleta de tweets e os métodos de aprendizado de máquina para classificação dos tweets. Inicialmente, são utilizadas e apresentadas três técnicas de classificação de textos conhecidas como: Naive-Bayes, Árvore de Decisão e Máquinas de Vetores de Suporte (SVM). Um estudo de validação cruzada é realizado em cada uma das técnicas e essas são comparadas sob o ponto de vista da eficiência de classificação e tempo computacional.To understand crime dynamics is essential for the development of public politics to control many types os crimes. In this study, we aim to map the crime occurrences at the state of São Paulo by collecting posts from the Twitter Social Web. Using the coollected data and machine learning techniques this study aim to classify, in an automatic way, the occurrences of crimes in the cited area. This way, we are able to dinamically visualize space time aspects of the crime distribution due to the possibility of real time collection of data. In this work, we present how to collect tweets and the machine learning methodology for the tweet classification. At first, we present and use three text classification techniques, known as, Naive-Bayes, Decision Trees and Support Vector Machines (SVM). Next, a cross validation study is performed for each technique and they are compared by classification eficiency and computational time.Universidade Federal de Minas GeraisUFMGEstatísticaEstatística criminalTwitterMineração de dados (Computação)ProbabilidadesÁrvore de decisãoTwitterMineração de textoSVMNaive-BayesEstudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitterinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALdissertacao_larissasayurifutino.pdfapplication/pdf4294301https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/1/dissertacao_larissasayurifutino.pdfa689948a35def261c30f414c707d81a0MD51TEXTdissertacao_larissasayurifutino.pdf.txtdissertacao_larissasayurifutino.pdf.txtExtracted texttext/plain169953https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/2/dissertacao_larissasayurifutino.pdf.txt5f560cac2400d0bd0f11a541a0a8b4daMD521843/BUBD-9VDJH72019-11-14 13:48:41.95oai:repositorio.ufmg.br:1843/BUBD-9VDJH7Repositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T16:48:41Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter |
title |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter |
spellingShingle |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter Larissa Sayuri Futino Castro dos Santos Árvore de decisão Mineração de texto SVM Naive-Bayes Estatística Estatística criminal Mineração de dados (Computação) Probabilidades |
title_short |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter |
title_full |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter |
title_fullStr |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter |
title_full_unstemmed |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter |
title_sort |
Estudo online da dinâmica espaço-temporal de crimes através de dados da rede social Twitter |
author |
Larissa Sayuri Futino Castro dos Santos |
author_facet |
Larissa Sayuri Futino Castro dos Santos |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Marcos Oliveira Prates |
dc.contributor.advisor-co1.fl_str_mv |
Erica Castilho Rodrigues |
dc.contributor.referee1.fl_str_mv |
Erica Castilho Rodrigues |
dc.contributor.referee2.fl_str_mv |
Renato Martins Assuncao |
dc.contributor.referee3.fl_str_mv |
Rafael Izbicki |
dc.contributor.author.fl_str_mv |
Larissa Sayuri Futino Castro dos Santos |
contributor_str_mv |
Marcos Oliveira Prates Erica Castilho Rodrigues Erica Castilho Rodrigues Renato Martins Assuncao Rafael Izbicki |
dc.subject.por.fl_str_mv |
Árvore de decisão Mineração de texto SVM Naive-Bayes |
topic |
Árvore de decisão Mineração de texto SVM Naive-Bayes Estatística Estatística criminal Mineração de dados (Computação) Probabilidades |
dc.subject.other.pt_BR.fl_str_mv |
Estatística Estatística criminal Mineração de dados (Computação) Probabilidades |
description |
Entender a dinâmica criminal é essencial para criação de políticas públicas mais adequadas para o controle dos diversos tipos de crimes. Neste estudo, procura-se mapear a ocorrência de crimes no estado de São Paulo através da coleta de postagens na rede social Twitter. A partir da informação dos dados coletados e através de métodos de aprendizado de máquina, o trabalho tem como objetivo classificar, de forma inteiramente automatizada, a ocorrência ou não de um evento de crime na região citada. Assim, pode-se visualizar aspectos espaço tempo da distribuição dos diversos tipos de crimes de maneira dinâmica, pois as coletas podem ser realizadas em tempo real. Nesse trabalho, apresentamos a forma empregada para coleta de tweets e os métodos de aprendizado de máquina para classificação dos tweets. Inicialmente, são utilizadas e apresentadas três técnicas de classificação de textos conhecidas como: Naive-Bayes, Árvore de Decisão e Máquinas de Vetores de Suporte (SVM). Um estudo de validação cruzada é realizado em cada uma das técnicas e essas são comparadas sob o ponto de vista da eficiência de classificação e tempo computacional. |
publishDate |
2015 |
dc.date.issued.fl_str_mv |
2015-02-11 |
dc.date.accessioned.fl_str_mv |
2019-08-14T17:04:27Z |
dc.date.available.fl_str_mv |
2019-08-14T17:04:27Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/BUBD-9VDJH7 |
url |
http://hdl.handle.net/1843/BUBD-9VDJH7 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/1/dissertacao_larissasayurifutino.pdf https://repositorio.ufmg.br/bitstream/1843/BUBD-9VDJH7/2/dissertacao_larissasayurifutino.pdf.txt |
bitstream.checksum.fl_str_mv |
a689948a35def261c30f414c707d81a0 5f560cac2400d0bd0f11a541a0a8b4da |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589210631831552 |