Interfaces e métodos de pesquisa visual em imagens

Detalhes bibliográficos
Autor(a) principal: Cruz, Diogo Henrique da Silva
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.13/3111
Resumo: O objetivo principal deste trabalho foi desenvolver uma aplicação com uma interface gráfica que permita a utilização de métodos de processamento de imagem em pesquisas efetuadas por utilizadores comuns, assim como visualizar os resultados obtidos de forma rápida e eficiente. Isto porque a recente e rápida evolução de técnicas de processamento de imagem e do hardware suscitam interesse no estudo da sua aplicabilidade em pesquisa visual de imagens. A par desta evolução, atualmente podem também ser geradas com facilidade uma grande quantidade de imagens, tornando-se necessário desenvolver interfaces para visualizá-las, mas não tem havido muito progresso nos últimos anos. Assim sendo, e como os algoritmos implementados podem ser aplicados a coleções de imagens, foram também estudadas e desenvolvidas interfaces para visualizá-las. Foi feita uma revisão de literatura extensa que serviu para determinar que métodos seriam implementados, e como inspiração para desenvolver quatro modos de visualização, mais concretamente uma grelha de thumbnails, uma grelha de thumbnails de tamanho variável, uma pilha de imagens e uma espiral. Os métodos foram avaliados quanto ao desempenho e qualidade dos resultados. As visualizações foram avaliadas num teste com 9 participantes, em que foram realizadastarefas de pesquisa geral/específica. Relativamente ao desempenho, todos os métodos foram testados com CPU, e os compatíveis com GPU. Foram testadas várias configurações de hardware. Constatou-se que o desempenho é satisfatório, especialmente com GPU. A qualidade dos resultados de alguns métodos ficou aquém dos valores anunciados nas suas publicações, mas foi suficiente para serem úteis e satisfazerem as necessidades da aplicação. Os testes com utilizadores indicaram que as visualizações da mais rápida para a menos são Grelha Normal > Grelha Variável > Espiral > Pilha, sem diferenças significativas entre as grelhas. Constatou-se que a Grelha Normal tem a melhor pontuação SUS, seguida da Grelha Variável, Espiral e Pilha. As visualizações da mais útil para a menos são Grelha Variável > Grelha Normal > Pilha > Espiral. Os aspetos mais importantes foram o tempo necessário para encontrar os objetos, a dificuldade de localizá-los e a intuição. Não foram encontradas diferenças significativas de precisão, revocação e f-measure em ambos os tipos de tarefas.
id RCAP_df0e178d86c6e25c27b05a9183b5127e
oai_identifier_str oai:digituma.uma.pt:10400.13/3111
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Interfaces e métodos de pesquisa visual em imagensPesquisa visualInterfaces de pesquisaVisualização de imagensFeature matchingDeteção de objetosMachine learningVisual searchSearch interfacesImage visualizationFeature matchingObject detectionEngenharia Informática.Faculdade de Ciências Exatas e da EngenhariaDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaO objetivo principal deste trabalho foi desenvolver uma aplicação com uma interface gráfica que permita a utilização de métodos de processamento de imagem em pesquisas efetuadas por utilizadores comuns, assim como visualizar os resultados obtidos de forma rápida e eficiente. Isto porque a recente e rápida evolução de técnicas de processamento de imagem e do hardware suscitam interesse no estudo da sua aplicabilidade em pesquisa visual de imagens. A par desta evolução, atualmente podem também ser geradas com facilidade uma grande quantidade de imagens, tornando-se necessário desenvolver interfaces para visualizá-las, mas não tem havido muito progresso nos últimos anos. Assim sendo, e como os algoritmos implementados podem ser aplicados a coleções de imagens, foram também estudadas e desenvolvidas interfaces para visualizá-las. Foi feita uma revisão de literatura extensa que serviu para determinar que métodos seriam implementados, e como inspiração para desenvolver quatro modos de visualização, mais concretamente uma grelha de thumbnails, uma grelha de thumbnails de tamanho variável, uma pilha de imagens e uma espiral. Os métodos foram avaliados quanto ao desempenho e qualidade dos resultados. As visualizações foram avaliadas num teste com 9 participantes, em que foram realizadastarefas de pesquisa geral/específica. Relativamente ao desempenho, todos os métodos foram testados com CPU, e os compatíveis com GPU. Foram testadas várias configurações de hardware. Constatou-se que o desempenho é satisfatório, especialmente com GPU. A qualidade dos resultados de alguns métodos ficou aquém dos valores anunciados nas suas publicações, mas foi suficiente para serem úteis e satisfazerem as necessidades da aplicação. Os testes com utilizadores indicaram que as visualizações da mais rápida para a menos são Grelha Normal > Grelha Variável > Espiral > Pilha, sem diferenças significativas entre as grelhas. Constatou-se que a Grelha Normal tem a melhor pontuação SUS, seguida da Grelha Variável, Espiral e Pilha. As visualizações da mais útil para a menos são Grelha Variável > Grelha Normal > Pilha > Espiral. Os aspetos mais importantes foram o tempo necessário para encontrar os objetos, a dificuldade de localizá-los e a intuição. Não foram encontradas diferenças significativas de precisão, revocação e f-measure em ambos os tipos de tarefas.The main goal of this work was to develop an application with a GUI that allows common users access to complex image processing algorithms, as well as quick and efficient result browsing. This is because the recent and quick evolution of visual search techniques, hardware and its increased accessibility sparked interest in studying what is possible today. Along with this evolution there has been a huge increase in the number of images that are generated, making it necessary to develop new interfaces to visualize them, but there has not been significant progress recently. Because of this, and because the algorithms implemented can be applied to image collections, different interfaces were studied and developed in this work. The starting point was a literature review that served to determine which methods would be implemented and as inspiration for the development of four interfaces, including a grid of thumbnails, another with varying size thumbnails, a pile of images and a spiral. The performance and the quality of the results of the methods were evaluated. The visualizations were evaluated in a user test with 9 participants, where they were asked to perform broad/specific search tasks. Regarding the performance, every method was tested with CPU and when supported with GPU, in four different hardware configurations. It was found that the performance satisfies the application’s needs, especially when using a GPU. The quality of the results of some methods didn’t match the values announced by their authors in their original publications, but it was enough to be fulfil their purpose. The user tests indicated that the visualizations ordered from fastest to slowest are Regular Grid > Variable Size Grid > Spiral > Pile, with no significative difference between the grids. The Regular Grid got the best SUS score, followed by the Variable Size Grid, Spiral and Pile. The visualizations ordered from most to least useful are Variable Size Grid > Regular Grid > Pile > Spiral. The key aspects were the time required to locate the objects, the difficulty of spotting them and the intuitiveness. Regarding precision, recall and f-measure, no significative differences were found in both types of tasks.Campos, Pedro Filipe PereiraCabral, Diogo Nuno Crespo RibeiroDigitUMaCruz, Diogo Henrique da Silva2021-02-10T09:50:25Z2020-12-20T00:00:00Z2020-12-20T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.13/3111202599191porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-09-05T12:56:01Zoai:digituma.uma.pt:10400.13/3111Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T15:05:57.810839Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Interfaces e métodos de pesquisa visual em imagens
title Interfaces e métodos de pesquisa visual em imagens
spellingShingle Interfaces e métodos de pesquisa visual em imagens
Cruz, Diogo Henrique da Silva
Pesquisa visual
Interfaces de pesquisa
Visualização de imagens
Feature matching
Deteção de objetos
Machine learning
Visual search
Search interfaces
Image visualization
Feature matching
Object detection
Engenharia Informática
.
Faculdade de Ciências Exatas e da Engenharia
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Interfaces e métodos de pesquisa visual em imagens
title_full Interfaces e métodos de pesquisa visual em imagens
title_fullStr Interfaces e métodos de pesquisa visual em imagens
title_full_unstemmed Interfaces e métodos de pesquisa visual em imagens
title_sort Interfaces e métodos de pesquisa visual em imagens
author Cruz, Diogo Henrique da Silva
author_facet Cruz, Diogo Henrique da Silva
author_role author
dc.contributor.none.fl_str_mv Campos, Pedro Filipe Pereira
Cabral, Diogo Nuno Crespo Ribeiro
DigitUMa
dc.contributor.author.fl_str_mv Cruz, Diogo Henrique da Silva
dc.subject.por.fl_str_mv Pesquisa visual
Interfaces de pesquisa
Visualização de imagens
Feature matching
Deteção de objetos
Machine learning
Visual search
Search interfaces
Image visualization
Feature matching
Object detection
Engenharia Informática
.
Faculdade de Ciências Exatas e da Engenharia
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Pesquisa visual
Interfaces de pesquisa
Visualização de imagens
Feature matching
Deteção de objetos
Machine learning
Visual search
Search interfaces
Image visualization
Feature matching
Object detection
Engenharia Informática
.
Faculdade de Ciências Exatas e da Engenharia
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description O objetivo principal deste trabalho foi desenvolver uma aplicação com uma interface gráfica que permita a utilização de métodos de processamento de imagem em pesquisas efetuadas por utilizadores comuns, assim como visualizar os resultados obtidos de forma rápida e eficiente. Isto porque a recente e rápida evolução de técnicas de processamento de imagem e do hardware suscitam interesse no estudo da sua aplicabilidade em pesquisa visual de imagens. A par desta evolução, atualmente podem também ser geradas com facilidade uma grande quantidade de imagens, tornando-se necessário desenvolver interfaces para visualizá-las, mas não tem havido muito progresso nos últimos anos. Assim sendo, e como os algoritmos implementados podem ser aplicados a coleções de imagens, foram também estudadas e desenvolvidas interfaces para visualizá-las. Foi feita uma revisão de literatura extensa que serviu para determinar que métodos seriam implementados, e como inspiração para desenvolver quatro modos de visualização, mais concretamente uma grelha de thumbnails, uma grelha de thumbnails de tamanho variável, uma pilha de imagens e uma espiral. Os métodos foram avaliados quanto ao desempenho e qualidade dos resultados. As visualizações foram avaliadas num teste com 9 participantes, em que foram realizadastarefas de pesquisa geral/específica. Relativamente ao desempenho, todos os métodos foram testados com CPU, e os compatíveis com GPU. Foram testadas várias configurações de hardware. Constatou-se que o desempenho é satisfatório, especialmente com GPU. A qualidade dos resultados de alguns métodos ficou aquém dos valores anunciados nas suas publicações, mas foi suficiente para serem úteis e satisfazerem as necessidades da aplicação. Os testes com utilizadores indicaram que as visualizações da mais rápida para a menos são Grelha Normal > Grelha Variável > Espiral > Pilha, sem diferenças significativas entre as grelhas. Constatou-se que a Grelha Normal tem a melhor pontuação SUS, seguida da Grelha Variável, Espiral e Pilha. As visualizações da mais útil para a menos são Grelha Variável > Grelha Normal > Pilha > Espiral. Os aspetos mais importantes foram o tempo necessário para encontrar os objetos, a dificuldade de localizá-los e a intuição. Não foram encontradas diferenças significativas de precisão, revocação e f-measure em ambos os tipos de tarefas.
publishDate 2020
dc.date.none.fl_str_mv 2020-12-20T00:00:00Z
2020-12-20T00:00:00Z
2021-02-10T09:50:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.13/3111
202599191
url http://hdl.handle.net/10400.13/3111
identifier_str_mv 202599191
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799129930561224704