Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15022024-122742/ |
Resumo: | Indexar e recuperar informações organizadas em bases de dados, de modo eficiente e preciso para responder às consultas solicitadas pelos usuários, são pilares do processo de engenharia e ciência de dados. No contexto médico, o tratamento e extração de semântica do dado complexo do tipo imagem, são fundamentais para tomadas de decisões. Esse tipo de tratamento demanda extrair a essência (características) desses dados e usualmente efetuar consultas por similaridade sobre tais características, em vez de usar o dado complexo em si. Os Métodos de Acesso Métrico (MAMs) foram desenvolvidos como ferramentas fundamentais para processar consultas por similaridade de modo eficiente apoiando os sistemas de gerenciamento de bases de dados. Os MAMs utilizam funções de distância fixas para realizar a construção da árvore métrica, o que por sua vez impede que um MAM consiga indexar os elementos utilizando duas ou mais funções de distância na mesma indexação. Em muitos casos, o uso de funções de distância tradicionais falha em oferecer respostas compatíveis com a percepção de distância dos usuários. Esta pesquisa em nível de Mestrado desenvolveu mecanismos para tratar esse problema, desenvolvendo uma abordagem que permita incluir funções de distâncias ponderadas para o processamento de consultas por similaridade em MAM. Um vetor de pesos corretamente aprendido, permite ponderar funções de distâncias e aprimorar a semântica dos dados, trazendo maior precisão ao processamento de consultas. Deve-se, para isso, utilizar recursos de Realimentação de Relevância (RR), visando capturar a percepção do usuário com relação à semelhança entre imagens. Este trabalho propõe dois métodos que tratam o aprimoramento do espaço de características e inclusão de funções de distância ponderadas no MAM Slim-Tree. O método Fusion Relevance Feedback (FRF) aplica um pré-processamento combinando extratores de características tradicionais e aprimorando o espaço de características utilizando RR, alcançando acurácias equivalentes e superiores em relação as técnicas de aprendizado profundo. O método Tuning Metrics Relevance Feedback (TMRF) infere vetores de pesos no MAM Slim-Tree e apresenta uma metodologia de reindexação que mantêm a estrutura otimizada com o espaço métrico aprimorando. As análises realizadas demonstram que o método TMRF aprimora o espaço métrico do conjunto de dados e mantém o MAM eficiente, sendo 70% mais rápida em relação a estratégias sequenciais, com ganhos expressivos em termos de acurácia de até 42% através de aprendizado por RR. |
id |
USP_d8095796bf6d693007cfa1a5399f66d0 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-15022024-122742 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens MédicasDevelopment of a Metric Access Method with Perceptual Distance Calibration for Medical Image Similarity QueriesCBIRCBIRConsultas por similaridadeFunções de distância ponderadaMAMMAMMétodo de acesso métricoMetric access methodRealimentação de relevânciaRelevance feedbackSemantic similarity queriesWeighted distance functionsIndexar e recuperar informações organizadas em bases de dados, de modo eficiente e preciso para responder às consultas solicitadas pelos usuários, são pilares do processo de engenharia e ciência de dados. No contexto médico, o tratamento e extração de semântica do dado complexo do tipo imagem, são fundamentais para tomadas de decisões. Esse tipo de tratamento demanda extrair a essência (características) desses dados e usualmente efetuar consultas por similaridade sobre tais características, em vez de usar o dado complexo em si. Os Métodos de Acesso Métrico (MAMs) foram desenvolvidos como ferramentas fundamentais para processar consultas por similaridade de modo eficiente apoiando os sistemas de gerenciamento de bases de dados. Os MAMs utilizam funções de distância fixas para realizar a construção da árvore métrica, o que por sua vez impede que um MAM consiga indexar os elementos utilizando duas ou mais funções de distância na mesma indexação. Em muitos casos, o uso de funções de distância tradicionais falha em oferecer respostas compatíveis com a percepção de distância dos usuários. Esta pesquisa em nível de Mestrado desenvolveu mecanismos para tratar esse problema, desenvolvendo uma abordagem que permita incluir funções de distâncias ponderadas para o processamento de consultas por similaridade em MAM. Um vetor de pesos corretamente aprendido, permite ponderar funções de distâncias e aprimorar a semântica dos dados, trazendo maior precisão ao processamento de consultas. Deve-se, para isso, utilizar recursos de Realimentação de Relevância (RR), visando capturar a percepção do usuário com relação à semelhança entre imagens. Este trabalho propõe dois métodos que tratam o aprimoramento do espaço de características e inclusão de funções de distância ponderadas no MAM Slim-Tree. O método Fusion Relevance Feedback (FRF) aplica um pré-processamento combinando extratores de características tradicionais e aprimorando o espaço de características utilizando RR, alcançando acurácias equivalentes e superiores em relação as técnicas de aprendizado profundo. O método Tuning Metrics Relevance Feedback (TMRF) infere vetores de pesos no MAM Slim-Tree e apresenta uma metodologia de reindexação que mantêm a estrutura otimizada com o espaço métrico aprimorando. As análises realizadas demonstram que o método TMRF aprimora o espaço métrico do conjunto de dados e mantém o MAM eficiente, sendo 70% mais rápida em relação a estratégias sequenciais, com ganhos expressivos em termos de acurácia de até 42% através de aprendizado por RR.Indexing and retrieving information organized in databases efficiently and accurately to respond to queries requested by users and specialists are pillars of the engineering and data science process. In the medical context, complex image-type datas management and semantic extraction are fundamental for decision-making. This type of management requires extracting the essence (features) of these data and usually carrying out similar queries on such features, instead of using the complex data itself. The Metric Access Methods (MAMs) were developed as fundamental tools to process similarity queries supporting database management systems efficiently. MAMs use fixed distance functions to build the metric tree, which in turn prevents a MAM from being able to index elements using two or more distance functions in the same index. In many cases, the use of traditional distance functions fails to provide answers compatible with users perception of distance. This Masters level research developed novel mechanisms to deal with this issue, developing an approach that allows including weighted distance functions for processing similarity queries in MAM. A properly learned vector of weights allows weighting distance functions and improving data semantics, enhancing the query processing accuracy. For this intent, resources of Relevance Feedback (RF) were used, to capture the users perception regarding the similarity between images. This work proposes two methods to enhance the feature space and include weighted distance functions in the Slim-Tree MAM. The method Fusion Relevance Feedback (FRF) applies a pre-processing step combining traditional feature extractors and improving the feature space using RF, achieving equivalent and superior accuracies compared to deep learning techniques. The Tuning Metrics Relevance Feedback (TMRF) method infers weight vectors in the Slim-Tree and presents a reindexing methodology that keeps the structure optimized with the metric space improving. The analyses demonstrated that the TMRF method improves the metric space of the data set and keeps the MAM efficient, being 70% faster in relation to sequential strategies, with expressive gains in accuracy of up to 42% through learning by RF.Biblioteca Digitais de Teses e Dissertações da USPTraina, Agma Juci MachadoMarcacini, Renato Gomes2023-12-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-15022024-122742/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-02-15T17:24:02Zoai:teses.usp.br:tde-15022024-122742Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-02-15T17:24:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas Development of a Metric Access Method with Perceptual Distance Calibration for Medical Image Similarity Queries |
title |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas |
spellingShingle |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas Marcacini, Renato Gomes CBIR CBIR Consultas por similaridade Funções de distância ponderada MAM MAM Método de acesso métrico Metric access method Realimentação de relevância Relevance feedback Semantic similarity queries Weighted distance functions |
title_short |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas |
title_full |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas |
title_fullStr |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas |
title_full_unstemmed |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas |
title_sort |
Desenvolvimento de Método de Acesso Métrico com Calibração de Distância Perceptual para Consultas por Similaridade de Imagens Médicas |
author |
Marcacini, Renato Gomes |
author_facet |
Marcacini, Renato Gomes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Traina, Agma Juci Machado |
dc.contributor.author.fl_str_mv |
Marcacini, Renato Gomes |
dc.subject.por.fl_str_mv |
CBIR CBIR Consultas por similaridade Funções de distância ponderada MAM MAM Método de acesso métrico Metric access method Realimentação de relevância Relevance feedback Semantic similarity queries Weighted distance functions |
topic |
CBIR CBIR Consultas por similaridade Funções de distância ponderada MAM MAM Método de acesso métrico Metric access method Realimentação de relevância Relevance feedback Semantic similarity queries Weighted distance functions |
description |
Indexar e recuperar informações organizadas em bases de dados, de modo eficiente e preciso para responder às consultas solicitadas pelos usuários, são pilares do processo de engenharia e ciência de dados. No contexto médico, o tratamento e extração de semântica do dado complexo do tipo imagem, são fundamentais para tomadas de decisões. Esse tipo de tratamento demanda extrair a essência (características) desses dados e usualmente efetuar consultas por similaridade sobre tais características, em vez de usar o dado complexo em si. Os Métodos de Acesso Métrico (MAMs) foram desenvolvidos como ferramentas fundamentais para processar consultas por similaridade de modo eficiente apoiando os sistemas de gerenciamento de bases de dados. Os MAMs utilizam funções de distância fixas para realizar a construção da árvore métrica, o que por sua vez impede que um MAM consiga indexar os elementos utilizando duas ou mais funções de distância na mesma indexação. Em muitos casos, o uso de funções de distância tradicionais falha em oferecer respostas compatíveis com a percepção de distância dos usuários. Esta pesquisa em nível de Mestrado desenvolveu mecanismos para tratar esse problema, desenvolvendo uma abordagem que permita incluir funções de distâncias ponderadas para o processamento de consultas por similaridade em MAM. Um vetor de pesos corretamente aprendido, permite ponderar funções de distâncias e aprimorar a semântica dos dados, trazendo maior precisão ao processamento de consultas. Deve-se, para isso, utilizar recursos de Realimentação de Relevância (RR), visando capturar a percepção do usuário com relação à semelhança entre imagens. Este trabalho propõe dois métodos que tratam o aprimoramento do espaço de características e inclusão de funções de distância ponderadas no MAM Slim-Tree. O método Fusion Relevance Feedback (FRF) aplica um pré-processamento combinando extratores de características tradicionais e aprimorando o espaço de características utilizando RR, alcançando acurácias equivalentes e superiores em relação as técnicas de aprendizado profundo. O método Tuning Metrics Relevance Feedback (TMRF) infere vetores de pesos no MAM Slim-Tree e apresenta uma metodologia de reindexação que mantêm a estrutura otimizada com o espaço métrico aprimorando. As análises realizadas demonstram que o método TMRF aprimora o espaço métrico do conjunto de dados e mantém o MAM eficiente, sendo 70% mais rápida em relação a estratégias sequenciais, com ganhos expressivos em termos de acurácia de até 42% através de aprendizado por RR. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-12-21 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15022024-122742/ |
url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-15022024-122742/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256985171394560 |