Inferência da localização de residência de usuários de redes sociais a partir de dados públicos

Detalhes bibliográficos
Autor(a) principal: Tatiana Pontes Soares Rocha
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFMG
Texto Completo: http://hdl.handle.net/1843/ESBF-97GJWS
Resumo: A crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros.
id UFMG_58c8a1a92abf595c3514308fb10b5752
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-97GJWS
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Jussara Marques de AlmeidaPonnurangam KumaraguruClodoveu Augusto Davis JuniorMarcos Andre GoncalvesVirgilio Augusto Fernandes Almeidamaria da Graça Campos PimentelPonnurangam KumaraguruTatiana Pontes Soares Rocha2019-08-11T04:56:30Z2019-08-11T04:56:30Z2013-03-11http://hdl.handle.net/1843/ESBF-97GJWSA crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros.The increasing access to social media, associated to the ease of use of sharing services, have fostered the voluntary generation of a large amount of personal data in these environments. The shared information, which vary from photos of everyday life to professional associations, can be exploited for various purposes. While these data provide opportunities for users to strengthen their ties in social networks, they also favour the development of personalised mechanisms and more efficient recommendation strategies. However, the same data can also be manipulated to promote malicious and unwanted viral marketing or access sensitive information about users. The privacy breach frequently occurs due to unawareness and carelessness of people about making information publicly available. With the rise of the location-based services, an additional aspect is added to the data related to geographic information, which makes the discussion about privacy even more incisive, since such data can endanger the physical safety of users, allowing them to be tracked. In this dissertation, we explore one of the most popular location-based social networks, Foursquare, aiming at investigating how its members exploit public system resources (specifically the attributes that are associated to geographic information). The characterisation of human behaviour in Foursquare consists of a study which aggregates about 13 million users and aims to observe the potential of geographic attributes in the system to act as sources of information leakage. In this context, we propose various inference models in an attempt to reveal the home location of users through their geographic data publicly available. Although the models are generic, being able to produce inferences at various scales, we focus on finer-grained inferences at the city and geographic coordinate levels that, if successful, represent greater risks to individual privacy. Our experimental evaluation indicates that the proposed models can easily infer the city where users live with an accuracy of about 78% within a radius of 50 kilometres. At an even finer scale, we correctly infer the coordinates of the users home with approximately 60% accuracy within a 5 kilometres radius.Universidade Federal de Minas GeraisUFMGComputaçãoRedes sociais on-lineFoursquareRedes sociaisLocalizaçãoResidênciaInferênciaPrivacidadeFoursquareInferência da localização de residência de usuários de redes sociais a partir de dados públicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtatianapontes.pdfapplication/pdf2517738https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/1/tatianapontes.pdf48ac6eea0fbb20887d87681905822484MD51TEXTtatianapontes.pdf.txttatianapontes.pdf.txtExtracted texttext/plain175549https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/2/tatianapontes.pdf.txt2ae0a639a43cd6ad3a350ffce203c7aaMD521843/ESBF-97GJWS2019-11-14 07:55:03.284oai:repositorio.ufmg.br:1843/ESBF-97GJWSRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:55:03Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
title Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
spellingShingle Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
Tatiana Pontes Soares Rocha
Redes sociais
Localização
Residência
Inferência
Privacidade
Foursquare
Computação
Redes sociais on-line
Foursquare
title_short Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
title_full Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
title_fullStr Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
title_full_unstemmed Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
title_sort Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
author Tatiana Pontes Soares Rocha
author_facet Tatiana Pontes Soares Rocha
author_role author
dc.contributor.advisor1.fl_str_mv Jussara Marques de Almeida
dc.contributor.advisor-co1.fl_str_mv Ponnurangam Kumaraguru
dc.contributor.referee1.fl_str_mv Clodoveu Augusto Davis Junior
dc.contributor.referee2.fl_str_mv Marcos Andre Goncalves
dc.contributor.referee3.fl_str_mv Virgilio Augusto Fernandes Almeida
dc.contributor.referee4.fl_str_mv maria da Graça Campos Pimentel
dc.contributor.referee5.fl_str_mv Ponnurangam Kumaraguru
dc.contributor.author.fl_str_mv Tatiana Pontes Soares Rocha
contributor_str_mv Jussara Marques de Almeida
Ponnurangam Kumaraguru
Clodoveu Augusto Davis Junior
Marcos Andre Goncalves
Virgilio Augusto Fernandes Almeida
maria da Graça Campos Pimentel
Ponnurangam Kumaraguru
dc.subject.por.fl_str_mv Redes sociais
Localização
Residência
Inferência
Privacidade
Foursquare
topic Redes sociais
Localização
Residência
Inferência
Privacidade
Foursquare
Computação
Redes sociais on-line
Foursquare
dc.subject.other.pt_BR.fl_str_mv Computação
Redes sociais on-line
Foursquare
description A crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros.
publishDate 2013
dc.date.issued.fl_str_mv 2013-03-11
dc.date.accessioned.fl_str_mv 2019-08-11T04:56:30Z
dc.date.available.fl_str_mv 2019-08-11T04:56:30Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-97GJWS
url http://hdl.handle.net/1843/ESBF-97GJWS
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/1/tatianapontes.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/2/tatianapontes.pdf.txt
bitstream.checksum.fl_str_mv 48ac6eea0fbb20887d87681905822484
2ae0a639a43cd6ad3a350ffce203c7aa
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1803589182841421824