Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos

Detalhes bibliográficos
Autor(a) principal: Lara, Arnaldo Câmara
Data de Publicação: 2013
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-29042013-111855/
Resumo: A área de reconhecimento de objetos tem assistido a um impressionante progresso na última década. O estudo de descritores, aliado à estratégias de amostragem usando quantizações espaciais e a combinação de classificadores têm permeado o estado da arte nos últimos anos. Neste trabalho é proposta uma nova quantização espacial com número arbitrário de níveis e subdivisões arbitrárias de regiões. Regiões adjacentes possuem sobreposição gerando redundância na representação destas regiões de fronteiras e, assim, evitando as quebras que acontecem nas pirâmides espaciais tradicionais que prejudicam a interpretação das formas. Apesar de melhorar o desempenho da abordagem do saco de palavras, as pirâmides espaciais não são robustas a variações na orientação dos objetos na imagem. Foi também proposto neste trabalho, uma divisão espacial utilizando regiões circulares concêntricas que aumentam a robustez a rotação dos objetos na imagem em aproximadamente 80% quando comparada às pirâmides espaciais. Além das novas divisões espaciais, é proposto neste trabalho um novo descritor baseado na aplicação de granulometria morfológica no mapa de bordas da imagem original. Este descritor foi utilizado na criação de modelos de classes em aplicações de categorização de objetos utilizando uma base de dados pública com resultados superiores aos do melhor descritor baseado em bordas reportado pela literatura. Todas estas novas técnicas propostas foram utilizadas em um problema desafiador de categorização de objetos de classes muito parecidas. Foi utilizado um subconjunto da base de pássaros Caltech-UCSD Birds-200 2011 com resultados comparáveis aos melhores resultados reportados pela literatura. A abordagem proposta cria uma classificação de dois níveis e utiliza modelos específicos por classe o que é intuitivo, pois cada espécie de pássaro possui características muito sutis que as diferenciam das demais espécies testadas. Vários descritores são utilizados na criação dos modelos de classes e uma combinação de classificadores gera a rotulação final para a amostra. O descritor proposto neste trabalho esteve presente no melhor modelo de 11 das 13 classes testadas e o resultado final obtido pela técnica de categorização proposta é o melhor resultado utilizando a abordagem do saco de palavras.
id USP_f079adef8f3a9ef6866f7d25ab736000
oai_identifier_str oai:teses.usp.br:tde-29042013-111855
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Descritor de bordas e quantização espacial flexível aplicados a categorização de objetosEdge-based descriptor and flexible spatial quantization applied to object categorization.categorização de objetosgranulometriagranulometryobject categorizationquantização espacialspatial quantizationA área de reconhecimento de objetos tem assistido a um impressionante progresso na última década. O estudo de descritores, aliado à estratégias de amostragem usando quantizações espaciais e a combinação de classificadores têm permeado o estado da arte nos últimos anos. Neste trabalho é proposta uma nova quantização espacial com número arbitrário de níveis e subdivisões arbitrárias de regiões. Regiões adjacentes possuem sobreposição gerando redundância na representação destas regiões de fronteiras e, assim, evitando as quebras que acontecem nas pirâmides espaciais tradicionais que prejudicam a interpretação das formas. Apesar de melhorar o desempenho da abordagem do saco de palavras, as pirâmides espaciais não são robustas a variações na orientação dos objetos na imagem. Foi também proposto neste trabalho, uma divisão espacial utilizando regiões circulares concêntricas que aumentam a robustez a rotação dos objetos na imagem em aproximadamente 80% quando comparada às pirâmides espaciais. Além das novas divisões espaciais, é proposto neste trabalho um novo descritor baseado na aplicação de granulometria morfológica no mapa de bordas da imagem original. Este descritor foi utilizado na criação de modelos de classes em aplicações de categorização de objetos utilizando uma base de dados pública com resultados superiores aos do melhor descritor baseado em bordas reportado pela literatura. Todas estas novas técnicas propostas foram utilizadas em um problema desafiador de categorização de objetos de classes muito parecidas. Foi utilizado um subconjunto da base de pássaros Caltech-UCSD Birds-200 2011 com resultados comparáveis aos melhores resultados reportados pela literatura. A abordagem proposta cria uma classificação de dois níveis e utiliza modelos específicos por classe o que é intuitivo, pois cada espécie de pássaro possui características muito sutis que as diferenciam das demais espécies testadas. Vários descritores são utilizados na criação dos modelos de classes e uma combinação de classificadores gera a rotulação final para a amostra. O descritor proposto neste trabalho esteve presente no melhor modelo de 11 das 13 classes testadas e o resultado final obtido pela técnica de categorização proposta é o melhor resultado utilizando a abordagem do saco de palavras.The object recognition area has experienced an impressive progress in the last decade. The study of descriptors, together with a sampling strategy using spatial quantization and the combination of classifiers have been presented in the state of art in recent years. This work proposes a new spatial quantizations with an arbitrary number of levels and divisions in each level. Adjacent regions have overlapping areas that generate redundant representation and avoid breakages in the structures that are in their border regions as it happens in the traditional spatial pyramids and impairs the correct interpretation of these structures. Despite spatial pyramids to improve the performance of the bag-of-words approach in object recognition, they are not robust to changes in object orientation in the image. It was also proposed, in this work, a spatial division using concentric circular regions that is almost 80% more robust to rotation of objects when compared to the spatial pyramids using rectangular divisions. In addition to the new spatial division of the image, it is proposed a new granulometric-based descriptor that it is applied to the map of edges of the original image. This descriptor was used in the building of categorys models for object categorization in a public database and showed a better performance than the most used edge-based descriptor reported in literature. All these new proposed techniques were used in a challenge problem of object categorization of very similar classes. It was used a subset of the public database Caltech-UCSD Birds-200 2011 and the method obtained results compared to the best results reported in the literature. The proposed approach uses a 2-level classification and builds class-specific models that are an intuitive way to model the species of birds as very subtle characteristics differ in each tested class of birds. Many descriptors are used in the building of models of species and a combination of classifiers generates the final label for a tested sample. The descriptor proposed here were presented in 11 of 13 best models of birds classes. The final result obtained by the proposed object categorization method is the best one using the bag-of-words approach.Biblioteca Digitais de Teses e Dissertações da USPHirata Junior, RobertoLara, Arnaldo Câmara2013-03-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/45/45134/tde-29042013-111855/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:10:35Zoai:teses.usp.br:tde-29042013-111855Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:10:35Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
Edge-based descriptor and flexible spatial quantization applied to object categorization.
title Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
spellingShingle Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
Lara, Arnaldo Câmara
categorização de objetos
granulometria
granulometry
object categorization
quantização espacial
spatial quantization
title_short Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
title_full Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
title_fullStr Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
title_full_unstemmed Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
title_sort Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
author Lara, Arnaldo Câmara
author_facet Lara, Arnaldo Câmara
author_role author
dc.contributor.none.fl_str_mv Hirata Junior, Roberto
dc.contributor.author.fl_str_mv Lara, Arnaldo Câmara
dc.subject.por.fl_str_mv categorização de objetos
granulometria
granulometry
object categorization
quantização espacial
spatial quantization
topic categorização de objetos
granulometria
granulometry
object categorization
quantização espacial
spatial quantization
description A área de reconhecimento de objetos tem assistido a um impressionante progresso na última década. O estudo de descritores, aliado à estratégias de amostragem usando quantizações espaciais e a combinação de classificadores têm permeado o estado da arte nos últimos anos. Neste trabalho é proposta uma nova quantização espacial com número arbitrário de níveis e subdivisões arbitrárias de regiões. Regiões adjacentes possuem sobreposição gerando redundância na representação destas regiões de fronteiras e, assim, evitando as quebras que acontecem nas pirâmides espaciais tradicionais que prejudicam a interpretação das formas. Apesar de melhorar o desempenho da abordagem do saco de palavras, as pirâmides espaciais não são robustas a variações na orientação dos objetos na imagem. Foi também proposto neste trabalho, uma divisão espacial utilizando regiões circulares concêntricas que aumentam a robustez a rotação dos objetos na imagem em aproximadamente 80% quando comparada às pirâmides espaciais. Além das novas divisões espaciais, é proposto neste trabalho um novo descritor baseado na aplicação de granulometria morfológica no mapa de bordas da imagem original. Este descritor foi utilizado na criação de modelos de classes em aplicações de categorização de objetos utilizando uma base de dados pública com resultados superiores aos do melhor descritor baseado em bordas reportado pela literatura. Todas estas novas técnicas propostas foram utilizadas em um problema desafiador de categorização de objetos de classes muito parecidas. Foi utilizado um subconjunto da base de pássaros Caltech-UCSD Birds-200 2011 com resultados comparáveis aos melhores resultados reportados pela literatura. A abordagem proposta cria uma classificação de dois níveis e utiliza modelos específicos por classe o que é intuitivo, pois cada espécie de pássaro possui características muito sutis que as diferenciam das demais espécies testadas. Vários descritores são utilizados na criação dos modelos de classes e uma combinação de classificadores gera a rotulação final para a amostra. O descritor proposto neste trabalho esteve presente no melhor modelo de 11 das 13 classes testadas e o resultado final obtido pela técnica de categorização proposta é o melhor resultado utilizando a abordagem do saco de palavras.
publishDate 2013
dc.date.none.fl_str_mv 2013-03-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/45/45134/tde-29042013-111855/
url http://www.teses.usp.br/teses/disponiveis/45/45134/tde-29042013-111855/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257455752380416