Towards optimization methods for movelets extraction in multiple aspect trajectory classification

Detalhes bibliográficos
Autor(a) principal: Portela, Tarlis Tortelli
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/247733
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2023.
id UFSC_44f3bc890cf9ada33312c8d445f45c67
oai_identifier_str oai:repositorio.ufsc.br:123456789/247733
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Towards optimization methods for movelets extraction in multiple aspect trajectory classificationComputaçãoMineração de dados (Computação)Análise de dadosAnálise de trajetóriasTese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2023.In the last few years there has been a significant increase in the collection of mobility data. By mobility data we refer to the collection of positioning data, called trajectories, of tracked moving objects. These objects could be humans, animals, vehicles or other devices like Internet of Things (IoT). The analysis of such data has been proved to be useful in several application domains from a urban scenario for traffic prediction or transportation means optimization, to maritime domain analysing vessels paths or environmental domain with the study of hurricanes evolution or animal behavior. One of the most typical and used analysis task on mobility data is classification, where trajectory data is automatically assigned a label or class. The explosion of social media data, sensors, IoT, and Internet-enabled sources allowed the semantic enrichment of such mobility data, which evolved from raw spatio-temporal data to high dimensional data. Mobility analysis, and specifically classification task, on such high dimensional data becomes therefore more challenging. In fact, existing trajectory classification methods have mainly considered space, time, and numerical data, ignoring the large number of semantic dimensions. Only recently research community proposed classification methods based on the concept of movelets that are the parts of a trajectory that better discriminate a class and that can therefore improve classification accuracy. State of the art methods in movelets extraction are computationally inefficient, which makes them unfeasible to be used for real large high dimensional datasets. The objective of this thesis is therefore to develop new algorithms for discovering movelets that are faster than state of the art while maintaining or improving classification accuracy. Our main contribution is a new high performance method for extracting movelets and classifying trajectories, called HiPerMovelets (High-performance Movelets). Experimental results show that HiPerMovelets is 10 times faster than the best state of the art method, reduces the high dimensionality problem, is more scalable, and presents a high classification accuracy in all evaluated datasets. A secondary contribution are the algorithms RandomMovelets and UltraMovelets. RandomMovelets reduces the search space by randomly extracting subtrajectories and evaluating their relevance for classification without exploring the entire dataset. UltraMovelets reduces the combinatorial explosion when exploring subtrajectories. Preliminary results suggest that these methods can reduce the search space, use less computational resources, and are at least 6 times faster than baselines.Nos últimos anos, houve um aumento significativo na coleta de dados de mobilidade. Dados de mobilidade referem-se ao conjunto de dados de posicionamento geográfico, chamados de trajetórias de objetos móveis. Esses objetos podem ser pessoas, animais, veículos ou outros dispositivos como a Internet das Coisas (IoT). A análise deste tipo de dados se revela útil em vários domínios de aplicação, desde um cenário urbano para previsão de tráfego ou otimização de meios de transporte, no domínio marítimo analisando trajetos de embarcações, no domínio ambiental com o estudo da evolução de furacões ou comportamento animal. Uma das tarefas de análise mais comuns e usadas em dados de mobilidade é a classificação, onde os dados de trajetória recebem automaticamente um rótulo ou classe. A explosão de dados de mídia social, sensores, IoT e outras fontes da Internet permitiram o enriquecimento semântico desses dados de mobilidade, que evoluíram de dados espaço-temporais brutos para dados de alta dimensionalidade. A análise de mobilidade, e especificamente a tarefa de classificação, em tais dados de alta dimensionalidade tem se tornado mais desafiadora. De fato, os métodos de classificação de trajetória existentes consideram principalmente espaço, tempo e dados numéricos, ignorando o grande número de dimensões semânticas. Apenas recentemente a comunidade de pesquisa propôs métodos de classificação baseados no conceito de movelets que são as partes de uma trajetória que melhor discriminam uma classe e que podem, portanto, melhorar a precisão da classificação. Métodos de última geração na extração de movelets são computacionalmente ineficientes, o que os torna inviáveis para serem usados em grandes conjuntos de dados de alta dimensão. O objetivo desta tese é, portanto, desenvolver novos algoritmos para descobrir movelets que sejam mais rápidos do que o estado da arte, mantendo ou melhorando a precisão da classificação. Nossa principal contribuição é um novo método de alto desempenho para extração de movelets e classificação de trajetórias, denominado HiPerMovelets (Movelets de alto desempenho). Os resultados experimentais mostram que o HiPerMovelets é 10 vezes mais rápido que o melhor método do estado da arte, reduz o problema de alta dimensionalidade, é mais escalável e apresenta uma alta precisão de classificação em todos os conjuntos de dados avaliados. Uma contribuição secundária são os algoritmos RandomMovelets e UltraMovelets. RandomMovelets reduz o espaço de busca extraindo subtrajetórias aleatoriamente e avaliando sua relevância para classificação sem explorar todo o conjunto de dados. UltraMovelets reduz a explosão combinatória ao explorar subtrajetórias. Os resultados preliminares sugerem que esses métodos podem reduzir o espaço de busca, usar menos recursos computacionais e são pelo menos 6 vezes mais rápidos que a linha de base.Bogorny, VaniaBernasconi, Anna MariaUniversidade Federal de Santa CatarinaPortela, Tarlis Tortelli2023-06-28T18:27:45Z2023-06-28T18:27:45Z2023info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis115 p.| il., gráfs.application/pdf381890https://repositorio.ufsc.br/handle/123456789/247733engreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2023-06-28T18:27:45Zoai:repositorio.ufsc.br:123456789/247733Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732023-06-28T18:27:45Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Towards optimization methods for movelets extraction in multiple aspect trajectory classification
title Towards optimization methods for movelets extraction in multiple aspect trajectory classification
spellingShingle Towards optimization methods for movelets extraction in multiple aspect trajectory classification
Portela, Tarlis Tortelli
Computação
Mineração de dados (Computação)
Análise de dados
Análise de trajetórias
title_short Towards optimization methods for movelets extraction in multiple aspect trajectory classification
title_full Towards optimization methods for movelets extraction in multiple aspect trajectory classification
title_fullStr Towards optimization methods for movelets extraction in multiple aspect trajectory classification
title_full_unstemmed Towards optimization methods for movelets extraction in multiple aspect trajectory classification
title_sort Towards optimization methods for movelets extraction in multiple aspect trajectory classification
author Portela, Tarlis Tortelli
author_facet Portela, Tarlis Tortelli
author_role author
dc.contributor.none.fl_str_mv Bogorny, Vania
Bernasconi, Anna Maria
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Portela, Tarlis Tortelli
dc.subject.por.fl_str_mv Computação
Mineração de dados (Computação)
Análise de dados
Análise de trajetórias
topic Computação
Mineração de dados (Computação)
Análise de dados
Análise de trajetórias
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2023.
publishDate 2023
dc.date.none.fl_str_mv 2023-06-28T18:27:45Z
2023-06-28T18:27:45Z
2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 381890
https://repositorio.ufsc.br/handle/123456789/247733
identifier_str_mv 381890
url https://repositorio.ufsc.br/handle/123456789/247733
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 115 p.| il., gráfs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1808652057248268288