Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus

Detalhes bibliográficos
Autor(a) principal: Gomes, Fernanda Oliveira
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/214734
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
id UFSC_1d41360fe1a8c61e5ade2929ad817611
oai_identifier_str oai:repositorio.ufsc.br:123456789/214734
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Privacy preserving on semantic trajectories: application on wi-fi connections of a university campusComputaçãoDireito à privacidadeAnonimizaçãoLANs sem fiosAlgorítmos computacionaisDissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.O recorrente aumento da utilização de dispositivos móveis permite que mais dados de trajetórias dos usuários sejam coletados diariamente. Tais dados podem vir a ser obtidos via GPS, sinais de antena de celular e entre outros meios. Nesse viés, ao agregar informações acerca do local visitado e da pessoa que realizou o percurso pode-se transformar a trajetória em uma trajetória semântica. Uma trajetória semântica é uma sequência de stops (paradas) e moves (movimentos) de uma pessoa durante o seu trajeto. Outro modo de se obter dados de trajetória são por meio das conexões Wi-Fi. Cada conexão realizada é considerada como ponto espaço-temporal de um trajeto. Diante disso, as redes wireless das universidades, ou de grandes complexos, são comumente compostas por diversos pontos de acesso os quais são distribuídos amplamente em torno do campus de modo a cobrir uma extensa área com o sinal Wi-Fi. Nesse ínterim, toda vez que se realiza uma conexão entre um dispositivo móvel e um ponto de acesso, dados como localização, identificação do aluno e hora são gerados e armazenados em um arquivo de log. Tal arquivo permite rastrear as trajetórias dos usuários dentro das universidades por meio da localização dos pontos de acesso e também do horário no qual a conexão foi efetuada. Com isso, através do atributo de identificação do aluno, torna-se possível associá-lo à quase-identificadores pessoais presentes na base de dados da universidade. Essas informações podem ser úteis para diversas áreas do conhecimento, variando desde o planejamento urbano, gestão do transporte público até a prevenção de epidemias. No entanto, a publicação desses dados podem vir a colocar em risco a privacidade dos estudantes e funcionários, uma vez que pessoas mal-intencionadas possam vir a ter acesso à esses dados, perseguições podem ser facilitadas, assim como, realização de crimes, criando uma ameaça à segurança das pessoas. Frente à isso, a fim de divulgar essas informações, foi proposta uma técnica de anonimização para dados de trajetórias semânticas criadas a partir de conexões a redes Wi-Fi ou de outras fontes com pontos espaçados, chamados Mix beta-k-anonymity. Tal abordagem utiliza um quase-identificador pessoal para agrupar pessoas e suas trajetórias. Para avaliar o método, foram criados modelos de ameaça adaptados para o cenário universitário. Com relação à escolha da variável quase-identificadora, foi realizado um estudo sobre o impacto de sua escolha. Infere-se com esse estudo que a escolha do atributo quase-identificador é crucial para a preservação da privacidade. E por fim, o método foi avaliado com dados de Wi-Fi de alunos de graduação da UFSC e foi discutida a eficácia da abordagem com relação à prevenção de ameaças. Nessa perspectiva, a aplicação do método em um campus universitário demonstrou que a comunidade acadêmica pode ter acesso a dados de qualidade para realização de pesquisas de diversas áreas do conhecimento no campus mantendo a privacidade dos usuários.Abstract : With the increased use of mobile devices, which capture information from users' locations using GPS or cell phone signal, the number of trajectory data created from their spatio-temporal evolution has grown considerably. Information about the person who made the route and about the places visited can be added to the trajectory, thus creating a semantic trajectory. It is also possible to create trajectories with the Wi-Fi connections of a network by considering that each connection represent a point of the trajectory. In universities, or large building complexes, it is common to find many access points widely distributed throughout the campus aiming to cover most of the area with Wi-Fi signal. Each time a connection between a device and an access point is performed, the data generated (e.g. location, users identification, and time) are stored in a log file. This file allows us to track back the trajectories of the users inside the universities by using the access points location and time of the connection. With the identification attribute of the users, it is possible to associate it with quasi-identifiers present in the university data systems. This data can be useful for several areas of knowledge, ranging from security, urban planning, public transport management, to epidemic prevention. Publication of such data may put the privacy of university users in risk. If malicious persons have access to this data, stalking can be facilitated, as well as operational support for committing crimes, leading to a threat to the safety of people. Given that, our work proposes a method of anonymization called Mix beta-k-anonymity. It anonymizes semantic trajectories by grouping the trajectory of people who share the same quasi-identifier. This approach provides a set of possible trajectories for a group of people with the same quasi-identifiers. We evaluated the method with Wi-Fi data from undergraduate students of UFSC, campus Trindade, and discussed the effectiveness of the approach in relation to the prevention of threats. After the application of this method, we showed that with the right choice of the quasi-identifier it is possible to anonymize semantic trajectories, making feasible the release of anonymized semantic trajectory data, with quality, for research in several areas of knowledge.Martina, Jean EversonUniversidade Federal de Santa CatarinaGomes, Fernanda Oliveira2020-10-21T21:09:10Z2020-10-21T21:09:10Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis92 p.| il., gráfs., tabs.application/pdf360736https://repositorio.ufsc.br/handle/123456789/214734engreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2020-10-21T21:09:10Zoai:repositorio.ufsc.br:123456789/214734Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732020-10-21T21:09:10Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
title Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
spellingShingle Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
Gomes, Fernanda Oliveira
Computação
Direito à privacidade
Anonimização
LANs sem fios
Algorítmos computacionais
title_short Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
title_full Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
title_fullStr Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
title_full_unstemmed Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
title_sort Privacy preserving on semantic trajectories: application on wi-fi connections of a university campus
author Gomes, Fernanda Oliveira
author_facet Gomes, Fernanda Oliveira
author_role author
dc.contributor.none.fl_str_mv Martina, Jean Everson
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Gomes, Fernanda Oliveira
dc.subject.por.fl_str_mv Computação
Direito à privacidade
Anonimização
LANs sem fios
Algorítmos computacionais
topic Computação
Direito à privacidade
Anonimização
LANs sem fios
Algorítmos computacionais
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019
2020-10-21T21:09:10Z
2020-10-21T21:09:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 360736
https://repositorio.ufsc.br/handle/123456789/214734
identifier_str_mv 360736
url https://repositorio.ufsc.br/handle/123456789/214734
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 92 p.| il., gráfs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808651924931608576