Inferência da localização de residência de usuários de redes sociais a partir de dados públicos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFMG |
Texto Completo: | http://hdl.handle.net/1843/ESBF-97GJWS |
Resumo: | A crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros. |
id |
UFMG_58c8a1a92abf595c3514308fb10b5752 |
---|---|
oai_identifier_str |
oai:repositorio.ufmg.br:1843/ESBF-97GJWS |
network_acronym_str |
UFMG |
network_name_str |
Repositório Institucional da UFMG |
repository_id_str |
|
spelling |
Jussara Marques de AlmeidaPonnurangam KumaraguruClodoveu Augusto Davis JuniorMarcos Andre GoncalvesVirgilio Augusto Fernandes Almeidamaria da Graça Campos PimentelPonnurangam KumaraguruTatiana Pontes Soares Rocha2019-08-11T04:56:30Z2019-08-11T04:56:30Z2013-03-11http://hdl.handle.net/1843/ESBF-97GJWSA crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros.The increasing access to social media, associated to the ease of use of sharing services, have fostered the voluntary generation of a large amount of personal data in these environments. The shared information, which vary from photos of everyday life to professional associations, can be exploited for various purposes. While these data provide opportunities for users to strengthen their ties in social networks, they also favour the development of personalised mechanisms and more efficient recommendation strategies. However, the same data can also be manipulated to promote malicious and unwanted viral marketing or access sensitive information about users. The privacy breach frequently occurs due to unawareness and carelessness of people about making information publicly available. With the rise of the location-based services, an additional aspect is added to the data related to geographic information, which makes the discussion about privacy even more incisive, since such data can endanger the physical safety of users, allowing them to be tracked. In this dissertation, we explore one of the most popular location-based social networks, Foursquare, aiming at investigating how its members exploit public system resources (specifically the attributes that are associated to geographic information). The characterisation of human behaviour in Foursquare consists of a study which aggregates about 13 million users and aims to observe the potential of geographic attributes in the system to act as sources of information leakage. In this context, we propose various inference models in an attempt to reveal the home location of users through their geographic data publicly available. Although the models are generic, being able to produce inferences at various scales, we focus on finer-grained inferences at the city and geographic coordinate levels that, if successful, represent greater risks to individual privacy. Our experimental evaluation indicates that the proposed models can easily infer the city where users live with an accuracy of about 78% within a radius of 50 kilometres. At an even finer scale, we correctly infer the coordinates of the users home with approximately 60% accuracy within a 5 kilometres radius.Universidade Federal de Minas GeraisUFMGComputaçãoRedes sociais on-lineFoursquareRedes sociaisLocalizaçãoResidênciaInferênciaPrivacidadeFoursquareInferência da localização de residência de usuários de redes sociais a partir de dados públicosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALtatianapontes.pdfapplication/pdf2517738https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/1/tatianapontes.pdf48ac6eea0fbb20887d87681905822484MD51TEXTtatianapontes.pdf.txttatianapontes.pdf.txtExtracted texttext/plain175549https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/2/tatianapontes.pdf.txt2ae0a639a43cd6ad3a350ffce203c7aaMD521843/ESBF-97GJWS2019-11-14 07:55:03.284oai:repositorio.ufmg.br:1843/ESBF-97GJWSRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T10:55:03Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false |
dc.title.pt_BR.fl_str_mv |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos |
title |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos |
spellingShingle |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos Tatiana Pontes Soares Rocha Redes sociais Localização Residência Inferência Privacidade Foursquare Computação Redes sociais on-line Foursquare |
title_short |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos |
title_full |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos |
title_fullStr |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos |
title_full_unstemmed |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos |
title_sort |
Inferência da localização de residência de usuários de redes sociais a partir de dados públicos |
author |
Tatiana Pontes Soares Rocha |
author_facet |
Tatiana Pontes Soares Rocha |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Jussara Marques de Almeida |
dc.contributor.advisor-co1.fl_str_mv |
Ponnurangam Kumaraguru |
dc.contributor.referee1.fl_str_mv |
Clodoveu Augusto Davis Junior |
dc.contributor.referee2.fl_str_mv |
Marcos Andre Goncalves |
dc.contributor.referee3.fl_str_mv |
Virgilio Augusto Fernandes Almeida |
dc.contributor.referee4.fl_str_mv |
maria da Graça Campos Pimentel |
dc.contributor.referee5.fl_str_mv |
Ponnurangam Kumaraguru |
dc.contributor.author.fl_str_mv |
Tatiana Pontes Soares Rocha |
contributor_str_mv |
Jussara Marques de Almeida Ponnurangam Kumaraguru Clodoveu Augusto Davis Junior Marcos Andre Goncalves Virgilio Augusto Fernandes Almeida maria da Graça Campos Pimentel Ponnurangam Kumaraguru |
dc.subject.por.fl_str_mv |
Redes sociais Localização Residência Inferência Privacidade Foursquare |
topic |
Redes sociais Localização Residência Inferência Privacidade Foursquare Computação Redes sociais on-line Foursquare |
dc.subject.other.pt_BR.fl_str_mv |
Computação Redes sociais on-line Foursquare |
description |
A crescente acessibilidade às mídias sociais atrelada à facilidade de uso dos serviços de compartilhamento têm propiciado a geração voluntária de um grande volume de dados pessoais nesses ambientes. As informações compartilhadas, que variam de fotos do cotidiano a associações profissionais, podem ser exploradas para os mais diversos fins. Ao mesmo tempo em que esses dados criam oportunidades para os usuários fortalecerem seus laços nas redes sociais, eles também favorecem o desenvolvimento de mecanismos personalizados e estratégias de recomendação mais eficientes. Entretanto, esses mesmos dados podem ser manipulados de forma maliciosa e indesejada para promover marketing viral ou acessar informações confidenciais sobre os usuários. A violação de privacidade ocorre frequentemente devido ao desconhecimento e descuido das pessoas em relação àquilo que divulgam e tornam público. Com o aumento de serviços baseados em localização, um aspecto adicional é incluído ao dado referente à informação geográfica, o que torna a discussão sobre privacidade ainda mais incisiva, visto que tais dados podem colocar em risco a integridade física dos usuários, permitindo que eles sejam rastreados. Neste trabalho, analisamos uma das mais populares redes sociais baseadas em localização, o Foursquare, com o intuito de investigar como os seus membros exploram os recursos públicos do sistema (especificamente os atributos que possuem informação geográfica associada). A caracterização do comportamento humano no Foursquare consiste de um estudo que agrega cerca de 13 milhões de usuários e visa observar o potencial dos atributos geográficos do sistema em agir como fontes de vazamento de informação. Nesse contexto, propomos variados modelos de inferência na tentativa de revelar a localização da residência dos usuários a partir de dados geográficos publicamente disponibilizados. Apesar dos modelos serem genéricos e poderem gerar inferências em diferentes níveis espaciais, focamos nas inferências mais refinadas, nas granularidades de cidade e de coordenada geográfica, que, se bem sucedidas, representam riscos maiores à privacidade individual. Nossa avaliação experimental indica que os modelos propostos são capazes de inferir facilmente a cidade onde os usuários moram com uma precisão de cerca de 78% dentro de um raio de 50 quilômetros. Num grau ainda mais fino, acertamos a localização exata da casa dos usuários no nível de coordenada geográfica com aproximadamente 60% de acurácia em um raio de 5 quilômetros. |
publishDate |
2013 |
dc.date.issued.fl_str_mv |
2013-03-11 |
dc.date.accessioned.fl_str_mv |
2019-08-11T04:56:30Z |
dc.date.available.fl_str_mv |
2019-08-11T04:56:30Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1843/ESBF-97GJWS |
url |
http://hdl.handle.net/1843/ESBF-97GJWS |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.publisher.initials.fl_str_mv |
UFMG |
publisher.none.fl_str_mv |
Universidade Federal de Minas Gerais |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFMG instname:Universidade Federal de Minas Gerais (UFMG) instacron:UFMG |
instname_str |
Universidade Federal de Minas Gerais (UFMG) |
instacron_str |
UFMG |
institution |
UFMG |
reponame_str |
Repositório Institucional da UFMG |
collection |
Repositório Institucional da UFMG |
bitstream.url.fl_str_mv |
https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/1/tatianapontes.pdf https://repositorio.ufmg.br/bitstream/1843/ESBF-97GJWS/2/tatianapontes.pdf.txt |
bitstream.checksum.fl_str_mv |
48ac6eea0fbb20887d87681905822484 2ae0a639a43cd6ad3a350ffce203c7aa |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG) |
repository.mail.fl_str_mv |
|
_version_ |
1803589182841421824 |