Representação e recuperação de imagens por meio de relações espaciais entre objetos

Detalhes bibliográficos
Autor(a) principal: Santos, D. N.
Data de Publicação: 2017
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da FEI
Texto Completo: https://repositorio.fei.edu.br/handle/FEI/301
Resumo: Com o crescente número de imagens digitais geradas a cada dia, também aumenta a necessidade de recuperar informação contida em grandes bases de imagens de maneira rápida e precisa. As técnicas aplicadas em recuperação de imagens fazem uso, em geral, de atributos extraídos das imagens e neste espaço de atributos fazem comparações através de métricas de similaridade. Como o foco destas técnicas de recuperação de conteúdo é o uso de atributos de baixo nível, existe um problema pois o conteúdo semântico não está relacionado com estas características de baixo nível. Além disto, as relações entre objetos não são consideradas. Este trabalho aborda este problema conhecido como lacuna semântica (do inglês semantic gap) e procura aplicar relações espaciais com o intuito de reduzir o impacto da lacuna semântica na análise de cenas. Neste trabalho, as relações espaciais são expressas em termos de preposições espaciais. Assim, para definir uma preposição à partir de uma imagem é necessário segmentar os objetos que compõem a imagem e para cada par de objetos segmentados estabelecer a topologia entre eles. Para realizar a segmentação, é utilizado redes neurais convolucionais. Considerando uma imagem, a rede neural provê um valor probabilístico pada cada pixel existente na imagem, consequentemente, regiões compreendidas por valores estimados referentes à mesma classe são consideradas como o objeto segmentado. Posteriormente, estes objetos são combinados em pares para o estabelecimento de relações binárias entre eles. De posse dos objetos e seus respectivos segmentos, relações mereotopológicas são estabelecidas de acordo com o Region Connection Calculus (RCC). A definição destas relações é efetuada através de um procedimento que visa associar um par de objetos indicados na imagem com uma das oito relações definidas no RCC. Estas relações encontradas, com base neste procedimento, serão traduzidas para preposições linguísticas (existentes na língua inglesa), através de uma outra rede neural. Por fim, a informação dos objetos e suas respectivas relações é utilizada para estender uma ontologia superior. A ontologia aplicada é o Suggested Upper Merged Ontology (SUMO). O procedimento de introduzir uma representação formal permite o estabelecimento de novas relações, desconhecidas a priori. Este fato possibilita a recuperação de imagens à partir de relações derivadas através dos axiomas existentes na representação formal aplicada.
id FEI_c3d9ca3286a606e1a360e6899f9a5f66
oai_identifier_str oai:repositorio.fei.edu.br:FEI/301
network_acronym_str FEI
network_name_str Biblioteca Digital de Teses e Dissertações da FEI
repository_id_str https://repositorio.fei.edu.br/oai/request
spelling Representação e recuperação de imagens por meio de relações espaciais entre objetosProcessamento de imagensRecuperação de imagensSegmentação de imagensCom o crescente número de imagens digitais geradas a cada dia, também aumenta a necessidade de recuperar informação contida em grandes bases de imagens de maneira rápida e precisa. As técnicas aplicadas em recuperação de imagens fazem uso, em geral, de atributos extraídos das imagens e neste espaço de atributos fazem comparações através de métricas de similaridade. Como o foco destas técnicas de recuperação de conteúdo é o uso de atributos de baixo nível, existe um problema pois o conteúdo semântico não está relacionado com estas características de baixo nível. Além disto, as relações entre objetos não são consideradas. Este trabalho aborda este problema conhecido como lacuna semântica (do inglês semantic gap) e procura aplicar relações espaciais com o intuito de reduzir o impacto da lacuna semântica na análise de cenas. Neste trabalho, as relações espaciais são expressas em termos de preposições espaciais. Assim, para definir uma preposição à partir de uma imagem é necessário segmentar os objetos que compõem a imagem e para cada par de objetos segmentados estabelecer a topologia entre eles. Para realizar a segmentação, é utilizado redes neurais convolucionais. Considerando uma imagem, a rede neural provê um valor probabilístico pada cada pixel existente na imagem, consequentemente, regiões compreendidas por valores estimados referentes à mesma classe são consideradas como o objeto segmentado. Posteriormente, estes objetos são combinados em pares para o estabelecimento de relações binárias entre eles. De posse dos objetos e seus respectivos segmentos, relações mereotopológicas são estabelecidas de acordo com o Region Connection Calculus (RCC). A definição destas relações é efetuada através de um procedimento que visa associar um par de objetos indicados na imagem com uma das oito relações definidas no RCC. Estas relações encontradas, com base neste procedimento, serão traduzidas para preposições linguísticas (existentes na língua inglesa), através de uma outra rede neural. Por fim, a informação dos objetos e suas respectivas relações é utilizada para estender uma ontologia superior. A ontologia aplicada é o Suggested Upper Merged Ontology (SUMO). O procedimento de introduzir uma representação formal permite o estabelecimento de novas relações, desconhecidas a priori. Este fato possibilita a recuperação de imagens à partir de relações derivadas através dos axiomas existentes na representação formal aplicada.Due to the increasing number of digital images generated every day, also increases the need to recover information contained in large databases of images quickly and accurately. The applied techniques in image retrieval, in general, make use of features extracted from images and in this feature space make comparisons through similarity metrics. As the focus of these techniques of content retrieval is the use of low level features, there is a problem because the semantic content is unrelated with these low level features. Besides, the relations between objects are not considered. This work addresses this problem also known as semantic gap and intends to apply spatial relations with the goal of reducing the semantic gap impact in the scene analysis. In this work, the spatial relations are expressed in terms of spatial prepositions. Thus, in order to define a preposition from an image it is necessary to segment the objects within the image and by each pair of segmented object establish the topology between them. To perform segmentation, neural networks are used. Considering one image, the neural network provides a probabilistic value for every pixel in the image, therefore, the regions covered by similar values belong to the same class and are considered as being the segmented object. Furthermore, these objects are combined in pairs in order to establish binary relations between them. Relying on the objects and their respective regions, mereotopological relations are established according to Region Connection Calculus (RCC). The definition of these relations is performed through a procedure that intends to assign a pair of objects identified in the image with one of the eight relations defined in RCC. These relations established, based on these procedure, are converted to linguistic prepositions (in English language), through another neural network. Finally, the object information and their respective relations is applied to extend an upper ontology. The applied ontology is the Suggested Upper Merged Ontology (SUMO). The procedure of introducing a formal representation allows the establishment of new relations, unknown a priori. This fact enables image retrieval from relations derived through the existing axioms in the applied formal representation.Centro Universitário FEI, São Bernardo do CampoSantos, Paulo EduardoSantos, D. N.2019-03-15T17:49:24Z2019-03-15T17:49:24Z2017info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfSANTOS, D. N. <b> Representação e recuperação de imagens por meio de relações espaciais entre objetos. </b> 2017. 115 p. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2017. Disponível em: <https://doi.org/10.31414/EE.2017.T.129488>. Acesso em: 19 mar. 2019.https://repositorio.fei.edu.br/handle/FEI/30110.31414/EE.2017.T.129488porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2024-03-01T22:48:23Zoai:repositorio.fei.edu.br:FEI/301Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2024-03-01T22:48:23Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv Representação e recuperação de imagens por meio de relações espaciais entre objetos
title Representação e recuperação de imagens por meio de relações espaciais entre objetos
spellingShingle Representação e recuperação de imagens por meio de relações espaciais entre objetos
Santos, D. N.
Processamento de imagens
Recuperação de imagens
Segmentação de imagens
title_short Representação e recuperação de imagens por meio de relações espaciais entre objetos
title_full Representação e recuperação de imagens por meio de relações espaciais entre objetos
title_fullStr Representação e recuperação de imagens por meio de relações espaciais entre objetos
title_full_unstemmed Representação e recuperação de imagens por meio de relações espaciais entre objetos
title_sort Representação e recuperação de imagens por meio de relações espaciais entre objetos
author Santos, D. N.
author_facet Santos, D. N.
author_role author
dc.contributor.none.fl_str_mv Santos, Paulo Eduardo
dc.contributor.author.fl_str_mv Santos, D. N.
dc.subject.por.fl_str_mv Processamento de imagens
Recuperação de imagens
Segmentação de imagens
topic Processamento de imagens
Recuperação de imagens
Segmentação de imagens
description Com o crescente número de imagens digitais geradas a cada dia, também aumenta a necessidade de recuperar informação contida em grandes bases de imagens de maneira rápida e precisa. As técnicas aplicadas em recuperação de imagens fazem uso, em geral, de atributos extraídos das imagens e neste espaço de atributos fazem comparações através de métricas de similaridade. Como o foco destas técnicas de recuperação de conteúdo é o uso de atributos de baixo nível, existe um problema pois o conteúdo semântico não está relacionado com estas características de baixo nível. Além disto, as relações entre objetos não são consideradas. Este trabalho aborda este problema conhecido como lacuna semântica (do inglês semantic gap) e procura aplicar relações espaciais com o intuito de reduzir o impacto da lacuna semântica na análise de cenas. Neste trabalho, as relações espaciais são expressas em termos de preposições espaciais. Assim, para definir uma preposição à partir de uma imagem é necessário segmentar os objetos que compõem a imagem e para cada par de objetos segmentados estabelecer a topologia entre eles. Para realizar a segmentação, é utilizado redes neurais convolucionais. Considerando uma imagem, a rede neural provê um valor probabilístico pada cada pixel existente na imagem, consequentemente, regiões compreendidas por valores estimados referentes à mesma classe são consideradas como o objeto segmentado. Posteriormente, estes objetos são combinados em pares para o estabelecimento de relações binárias entre eles. De posse dos objetos e seus respectivos segmentos, relações mereotopológicas são estabelecidas de acordo com o Region Connection Calculus (RCC). A definição destas relações é efetuada através de um procedimento que visa associar um par de objetos indicados na imagem com uma das oito relações definidas no RCC. Estas relações encontradas, com base neste procedimento, serão traduzidas para preposições linguísticas (existentes na língua inglesa), através de uma outra rede neural. Por fim, a informação dos objetos e suas respectivas relações é utilizada para estender uma ontologia superior. A ontologia aplicada é o Suggested Upper Merged Ontology (SUMO). O procedimento de introduzir uma representação formal permite o estabelecimento de novas relações, desconhecidas a priori. Este fato possibilita a recuperação de imagens à partir de relações derivadas através dos axiomas existentes na representação formal aplicada.
publishDate 2017
dc.date.none.fl_str_mv 2017
2019-03-15T17:49:24Z
2019-03-15T17:49:24Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SANTOS, D. N. <b> Representação e recuperação de imagens por meio de relações espaciais entre objetos. </b> 2017. 115 p. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2017. Disponível em: <https://doi.org/10.31414/EE.2017.T.129488>. Acesso em: 19 mar. 2019.
https://repositorio.fei.edu.br/handle/FEI/301
10.31414/EE.2017.T.129488
identifier_str_mv SANTOS, D. N. <b> Representação e recuperação de imagens por meio de relações espaciais entre objetos. </b> 2017. 115 p. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2017. Disponível em: <https://doi.org/10.31414/EE.2017.T.129488>. Acesso em: 19 mar. 2019.
10.31414/EE.2017.T.129488
url https://repositorio.fei.edu.br/handle/FEI/301
dc.language.iso.fl_str_mv por
pt_BR
language por
language_invalid_str_mv pt_BR
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Centro Universitário FEI, São Bernardo do Campo
publisher.none.fl_str_mv Centro Universitário FEI, São Bernardo do Campo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da FEI
instname:Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron:FEI
instname_str Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str FEI
institution FEI
reponame_str Biblioteca Digital de Teses e Dissertações da FEI
collection Biblioteca Digital de Teses e Dissertações da FEI
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv cfernandes@fei.edu.br
_version_ 1809225176828608512