A visual approach for user-guided feature fusion

Detalhes bibliográficos
Autor(a) principal: Mamani, Gladys Marleny Hilasaca
Data de Publicação: 2018
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-01042019-140258/
Resumo: The goal of Dimensionality Reduction is to transform the data from highdimensional space into visual space preserving the existing relationships of the data in the original space. This abstract representation of complex data enables exploration of data similarities, but brings challenges about the analysis and interpretation for users on mismatching between the visual representation and the user expectation. A possible way to model these understandings is via different features to describe an object, because each feature has its own way to encode characteristic. In this thesis, we propose a visual approach to support users to combine different features that best approach their point of view regarding similarity. Our approach is a two-step strategy, starting from a small sample of the features, where users can easily test different feature combinations and check in real-time the resulting similarity relationships. Once a combination that matches the user expectation is defined, it is propagated to the whole dataset through an affine transformation. A traditional way to visualize data similarities is via scatter plots, however, it suffers from overlap issues. Overlapping hides data distributions, and makes the relationship among data instances difficult to observe, which hampers data exploration. In this work, we present a technique called Distance-preserving Grid (DGrid) to tackle this issue. DGrid employs a binary space partitioning process in combination with Dimensionality Reduction output to create orthogonal regular grid layouts. DGrid ensures non-overlapping instances because each data instance is assigned only to one grid cell. Our results show that DGrid is as precise as the existing state-of-the-art techniques based on grid representations, whereas requiring only a fraction of the running time and computational resources. Despite its simplicity, the quality of the produced layouts and the running times render DGrid as a very attractive method for large datasets.
id USP_f5c742ec15d7ee27fb933787e1bfd5b6
oai_identifier_str oai:teses.usp.br:tde-01042019-140258
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling A visual approach for user-guided feature fusionUma abordagem visual para fusão de características guiada pelo usuárioAnalítica visualDimensionality reductionDistance preserving gridsExploratory data visualizationFeature fusionFusão de característicasGrades de preservação de distânciasGrid visualizationRedução de dimensionalidadeVisual analyticsVisualização em gradesVisualização exploratória de dadosThe goal of Dimensionality Reduction is to transform the data from highdimensional space into visual space preserving the existing relationships of the data in the original space. This abstract representation of complex data enables exploration of data similarities, but brings challenges about the analysis and interpretation for users on mismatching between the visual representation and the user expectation. A possible way to model these understandings is via different features to describe an object, because each feature has its own way to encode characteristic. In this thesis, we propose a visual approach to support users to combine different features that best approach their point of view regarding similarity. Our approach is a two-step strategy, starting from a small sample of the features, where users can easily test different feature combinations and check in real-time the resulting similarity relationships. Once a combination that matches the user expectation is defined, it is propagated to the whole dataset through an affine transformation. A traditional way to visualize data similarities is via scatter plots, however, it suffers from overlap issues. Overlapping hides data distributions, and makes the relationship among data instances difficult to observe, which hampers data exploration. In this work, we present a technique called Distance-preserving Grid (DGrid) to tackle this issue. DGrid employs a binary space partitioning process in combination with Dimensionality Reduction output to create orthogonal regular grid layouts. DGrid ensures non-overlapping instances because each data instance is assigned only to one grid cell. Our results show that DGrid is as precise as the existing state-of-the-art techniques based on grid representations, whereas requiring only a fraction of the running time and computational resources. Despite its simplicity, the quality of the produced layouts and the running times render DGrid as a very attractive method for large datasets.O objetivo da redução de dimensionalidade é transformar os dados de um espaço de alta dimensionalidade para um espaço visual preservando as relações existentes entre os dados no espaço original. Esta representação abstrata dos dados complexos permite a exploração das relações similaridade, mas traz desafios sobre a análise e interpretação para os usuários devido à incompatibilidade entre a representação visual e a expectativa do usuário. Uma maneira possível de modelar os entendimentos dos usuários é através de diferentes características que descrevem um mesmo objeto, porque cada característica tem sua própria forma de codficar propriedades. Nesta tese, propomos uma abordagem visual para auxiliar os usuários para combinar diferentes características que melhor se aproxime ao ponto de vista do usuario em quanto o que é similaridade. Nossa abordagem é uma estratégia de duas etapas, onde começando com uma pequena amostra das features os usuários podem testar facilmente diferentes combinações de features e verificar em tempo real as relações de similaridade resultantes. Uma vez definida a combinação que corresponda à expectativa do usuário, ela é propagada para todo o conjunto de dados por meio de uma transformação afim. Uma maneira tradicional de visualizar as relações de similaridade entre as instâncias de dados é através de scatterplot, no entanto, esse sofre de problemas de sobreposição. A sobreposição oculta a distribuição dos dados e dificulta na exploração das relações de similaridade. Neste trabalho, apresentamos uma técnica chamada Distance-preserving Grid (DGrid) para resolver esse problema. O DGrid emprega um processo de particionamento de espaço binário em combinação com a saída de uma redução de dimensionalidade para criar layouts de grade regulares. O DGrid garante que as instâncias não fiquem sobrepostas, devido a que cada instância de dados é atribuída apenas a uma célula da grade. Nossos resultados mostram que o DGrid é tão preciso quanto as técnicas existentes no estado da arte que estão baseadas na criação de grades, requerendo apenas uma fração do tempo de execução e poucos recursos computacionais. Apesar da sua simplicidade, a qualidade dos layouts produzidos e os tempos de execução tornam o DGrid um método muito atraente para grandes conjuntos de dados.Biblioteca Digitais de Teses e Dissertações da USPPaulovich, Fernando VieiraMamani, Gladys Marleny Hilasaca2018-12-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-01042019-140258/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-05-05T02:16:02Zoai:teses.usp.br:tde-01042019-140258Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-05-05T02:16:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv A visual approach for user-guided feature fusion
Uma abordagem visual para fusão de características guiada pelo usuário
title A visual approach for user-guided feature fusion
spellingShingle A visual approach for user-guided feature fusion
Mamani, Gladys Marleny Hilasaca
Analítica visual
Dimensionality reduction
Distance preserving grids
Exploratory data visualization
Feature fusion
Fusão de características
Grades de preservação de distâncias
Grid visualization
Redução de dimensionalidade
Visual analytics
Visualização em grades
Visualização exploratória de dados
title_short A visual approach for user-guided feature fusion
title_full A visual approach for user-guided feature fusion
title_fullStr A visual approach for user-guided feature fusion
title_full_unstemmed A visual approach for user-guided feature fusion
title_sort A visual approach for user-guided feature fusion
author Mamani, Gladys Marleny Hilasaca
author_facet Mamani, Gladys Marleny Hilasaca
author_role author
dc.contributor.none.fl_str_mv Paulovich, Fernando Vieira
dc.contributor.author.fl_str_mv Mamani, Gladys Marleny Hilasaca
dc.subject.por.fl_str_mv Analítica visual
Dimensionality reduction
Distance preserving grids
Exploratory data visualization
Feature fusion
Fusão de características
Grades de preservação de distâncias
Grid visualization
Redução de dimensionalidade
Visual analytics
Visualização em grades
Visualização exploratória de dados
topic Analítica visual
Dimensionality reduction
Distance preserving grids
Exploratory data visualization
Feature fusion
Fusão de características
Grades de preservação de distâncias
Grid visualization
Redução de dimensionalidade
Visual analytics
Visualização em grades
Visualização exploratória de dados
description The goal of Dimensionality Reduction is to transform the data from highdimensional space into visual space preserving the existing relationships of the data in the original space. This abstract representation of complex data enables exploration of data similarities, but brings challenges about the analysis and interpretation for users on mismatching between the visual representation and the user expectation. A possible way to model these understandings is via different features to describe an object, because each feature has its own way to encode characteristic. In this thesis, we propose a visual approach to support users to combine different features that best approach their point of view regarding similarity. Our approach is a two-step strategy, starting from a small sample of the features, where users can easily test different feature combinations and check in real-time the resulting similarity relationships. Once a combination that matches the user expectation is defined, it is propagated to the whole dataset through an affine transformation. A traditional way to visualize data similarities is via scatter plots, however, it suffers from overlap issues. Overlapping hides data distributions, and makes the relationship among data instances difficult to observe, which hampers data exploration. In this work, we present a technique called Distance-preserving Grid (DGrid) to tackle this issue. DGrid employs a binary space partitioning process in combination with Dimensionality Reduction output to create orthogonal regular grid layouts. DGrid ensures non-overlapping instances because each data instance is assigned only to one grid cell. Our results show that DGrid is as precise as the existing state-of-the-art techniques based on grid representations, whereas requiring only a fraction of the running time and computational resources. Despite its simplicity, the quality of the produced layouts and the running times render DGrid as a very attractive method for large datasets.
publishDate 2018
dc.date.none.fl_str_mv 2018-12-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-01042019-140258/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-01042019-140258/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1809090272031670272