Toward interpretable and hierarchical methods for dimensionality reduction

Detalhes bibliográficos
Autor(a) principal: Marcílio Junior, Wilson Estécio
Data de Publicação: 2023
Tipo de documento: Tese
Idioma: eng
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/242318
Resumo: Análise Exploratória de Dados (EDA) é uma ferramenta valiosa para descobrir novos insights a partir de dados de alta dimensão. Os procedimentos de EDA ajudam cientistas e profissionais a entender a relação entre instâncias de dados e estruturas usando metáforas visuais que enfatizam informações sobre o objetivo da análise. Amplamente empregadas para análise exploratória, técnicas de Redução de Dimensionalidade mapeiam o relacionamento presente em espaços de alta dimensão para espaços de dimensão menor, normalmente no R2, e permitem descobertas científicas que vão do entendimento do comportamento de redes neurais à anotação de tipos celulares. Esta tese apresenta um conjunto de abordagens para extender o poder de análise utilizando técnicas de Redução de Dimensionalidade, com o objetivo principal de ajudar no entendimento dos embeddings gerados por técnicas não-lineares, além do estabelecimento de abordagens de exploração hierárquica para análise de acordo com a demanda de informações. Tais abordagens foram resultados das seguintes atividades de pesquisa principais: (i) seleção de representativos no espaço visual com preservação do contexto e estruturas mapeadas; (ii) técnicas para análise de clustering utilizando contrastividade, permitindo o entendimento das diferenças entre instâncias de dados para a formação de clusters; (iii) explicação de forma aditiva do layout gerado por técnicas não lineares; (iv) técnica de redução hierárquica de dimensionalidade para análise granular de conjuntos de dados, que permite a preservação das estruturas entre níveis hierárquicos.
id UNSP_ac8f6e9a0b8841fba5c4f4b1087b1ae7
oai_identifier_str oai:repositorio.unesp.br:11449/242318
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Toward interpretable and hierarchical methods for dimensionality reductionMétodos interpretáveis e hierárquicos para redução de dimensionalidadeRedução hierárquica de dimensionalidadeInterpretaçãoAnálise contrastivaHierarchical dimensionality reductionInterpretationContrastive analysisAnálise Exploratória de Dados (EDA) é uma ferramenta valiosa para descobrir novos insights a partir de dados de alta dimensão. Os procedimentos de EDA ajudam cientistas e profissionais a entender a relação entre instâncias de dados e estruturas usando metáforas visuais que enfatizam informações sobre o objetivo da análise. Amplamente empregadas para análise exploratória, técnicas de Redução de Dimensionalidade mapeiam o relacionamento presente em espaços de alta dimensão para espaços de dimensão menor, normalmente no R2, e permitem descobertas científicas que vão do entendimento do comportamento de redes neurais à anotação de tipos celulares. Esta tese apresenta um conjunto de abordagens para extender o poder de análise utilizando técnicas de Redução de Dimensionalidade, com o objetivo principal de ajudar no entendimento dos embeddings gerados por técnicas não-lineares, além do estabelecimento de abordagens de exploração hierárquica para análise de acordo com a demanda de informações. Tais abordagens foram resultados das seguintes atividades de pesquisa principais: (i) seleção de representativos no espaço visual com preservação do contexto e estruturas mapeadas; (ii) técnicas para análise de clustering utilizando contrastividade, permitindo o entendimento das diferenças entre instâncias de dados para a formação de clusters; (iii) explicação de forma aditiva do layout gerado por técnicas não lineares; (iv) técnica de redução hierárquica de dimensionalidade para análise granular de conjuntos de dados, que permite a preservação das estruturas entre níveis hierárquicos.Exploratory Data Analysis (EDA) is a valuable tool for discovering new insights from high-dimensional data. EDA procedures help scientists and practitioners understand the relationship between data instances and structures using visual metaphors that emphasize information about the purpose of analysis. Widely used for exploratory analysis, Dimensionality Reduction techniques map the relationship present in high-dimensional spaces to smaller-dimensional spaces, usually in R2, and allow scientific discoveries that range from understanding the behavior of neural networks to the annotation of cell types. This thesis presents a set of approaches to extend the power of analysis using Dimensionality Reduction techniques, with the main objective of helping to understand the embeddings generated by non-linear techniques, in addition to establishing hierarchical exploration approaches for analysis according to the demand for information. Such approaches were the result of the following main research activities: (i) selection of representatives in the visual space with preservation of the context and mapped structures; (ii) techniques for analyzing clustering using contrastivity, allowing the understanding of differences between data instances for the formation of clusters; (iii) additive explanation of the layout generated by non-linear techniques; (iv) hierarchical dimensionality reduction technique for granular analysis of datasets, which allows the preservation of structures between hierarchical levels.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88887.487331/2020-00Universidade Estadual Paulista (Unesp)Eler, Danilo Medeiros [UNESP]Universidade Estadual Paulista (Unesp)Marcílio Junior, Wilson Estécio2023-03-06T14:11:41Z2023-03-06T14:11:41Z2023-02-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/11449/24231833004153073P2enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-19T06:09:26Zoai:repositorio.unesp.br:11449/242318Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T18:06:42.481532Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Toward interpretable and hierarchical methods for dimensionality reduction
Métodos interpretáveis e hierárquicos para redução de dimensionalidade
title Toward interpretable and hierarchical methods for dimensionality reduction
spellingShingle Toward interpretable and hierarchical methods for dimensionality reduction
Marcílio Junior, Wilson Estécio
Redução hierárquica de dimensionalidade
Interpretação
Análise contrastiva
Hierarchical dimensionality reduction
Interpretation
Contrastive analysis
title_short Toward interpretable and hierarchical methods for dimensionality reduction
title_full Toward interpretable and hierarchical methods for dimensionality reduction
title_fullStr Toward interpretable and hierarchical methods for dimensionality reduction
title_full_unstemmed Toward interpretable and hierarchical methods for dimensionality reduction
title_sort Toward interpretable and hierarchical methods for dimensionality reduction
author Marcílio Junior, Wilson Estécio
author_facet Marcílio Junior, Wilson Estécio
author_role author
dc.contributor.none.fl_str_mv Eler, Danilo Medeiros [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Marcílio Junior, Wilson Estécio
dc.subject.por.fl_str_mv Redução hierárquica de dimensionalidade
Interpretação
Análise contrastiva
Hierarchical dimensionality reduction
Interpretation
Contrastive analysis
topic Redução hierárquica de dimensionalidade
Interpretação
Análise contrastiva
Hierarchical dimensionality reduction
Interpretation
Contrastive analysis
description Análise Exploratória de Dados (EDA) é uma ferramenta valiosa para descobrir novos insights a partir de dados de alta dimensão. Os procedimentos de EDA ajudam cientistas e profissionais a entender a relação entre instâncias de dados e estruturas usando metáforas visuais que enfatizam informações sobre o objetivo da análise. Amplamente empregadas para análise exploratória, técnicas de Redução de Dimensionalidade mapeiam o relacionamento presente em espaços de alta dimensão para espaços de dimensão menor, normalmente no R2, e permitem descobertas científicas que vão do entendimento do comportamento de redes neurais à anotação de tipos celulares. Esta tese apresenta um conjunto de abordagens para extender o poder de análise utilizando técnicas de Redução de Dimensionalidade, com o objetivo principal de ajudar no entendimento dos embeddings gerados por técnicas não-lineares, além do estabelecimento de abordagens de exploração hierárquica para análise de acordo com a demanda de informações. Tais abordagens foram resultados das seguintes atividades de pesquisa principais: (i) seleção de representativos no espaço visual com preservação do contexto e estruturas mapeadas; (ii) técnicas para análise de clustering utilizando contrastividade, permitindo o entendimento das diferenças entre instâncias de dados para a formação de clusters; (iii) explicação de forma aditiva do layout gerado por técnicas não lineares; (iv) técnica de redução hierárquica de dimensionalidade para análise granular de conjuntos de dados, que permite a preservação das estruturas entre níveis hierárquicos.
publishDate 2023
dc.date.none.fl_str_mv 2023-03-06T14:11:41Z
2023-03-06T14:11:41Z
2023-02-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/242318
33004153073P2
url http://hdl.handle.net/11449/242318
identifier_str_mv 33004153073P2
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808128897205665792