Object recognition for semantic robot vision

Detalhes bibliográficos
Autor(a) principal: Ribeiro, Luís Miguel Saraiva
Data de Publicação: 2008
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10773/2057
Resumo: Reconhecer todos os objectos presentes numa qualquer imagem do dia-a-dia será um importante contributo para a compreensão autónoma de imagens. Um agente inteligente para perceber todas as dinâmicas do conteúdo semântico precisa primeiramente de reconhecer cada objecto na cena. Contudo, a aprendizagem e o reconhecimento de objectos sem supervisão, con- tinuam a ser um dos grandes desafios na área da visão robótica. O nosso trabalho é uma abordagem transversal a este problema. Nós construímos um agente capaz de localizar, numa cena complexa, instâncias de categorias previamente requisitadas. Com o nome da categoria o agente procura autonomamente imagens representativas da categoria na Internet. Com estas imagens aprende sem supervisão a aparência da categoria. Após a fase de aprendizagem, o agente procura instâncias da categoria numa fotografia estática do cenário. Esta dissertação é orientada á detecção e ao reconhecimento de objectos numa cena complexa. São usados dois modelos para descrever os objectos: Scale Invariant Feature Transform (SIFT) e o descritor de forma proposto por Deb Kumar Roy. Para localizar diferentes objectos de interesse na cena efectuamos segmentação de cena baseada nas saliências de cor. Após localizado, extraímos o objecto da imagem através da análise dos seus contornos, para finalmente reconhece-lo através da combinação de vários métodos de classificação. ABSTRACT: Recognizing objects in an everyday scene is a major step in unsupervised image understanding. An intelligent agent needs to first identify each object in an environment scene, so it could eventually understand all the dynamics of the semantic content. However, unsupervised learning and unsupervised object recognition remains a great challenge in the vision research area. Our work is a transverse approach in unsupervised object learning and object recognition. We built an agent capable of locating, in a complex scene, an instance of a requested category. The name of a category is uploaded to the agent's system and it autonomously learns the category appearance, by searching the Internet and looking for category examples. Then it explores a static picture of the surrounding environment, looking for an instance of the previously learned category. This dissertation focus on the object detection and object recognition in a complex picture scene. We use Scale Invariant Feature Transform (SIFT) and Roy's Shape Representation (RSR) to represent an object, and an ensemble of several classification techniques to recognize an object. To obtain the object's location on the complex scene we used scene segmentation, based on image colour saliencies, and object extraction based on contour analysis.
id RCAP_6fa6db0504c06f46fe0eb00536aa7b96
oai_identifier_str oai:ria.ua.pt:10773/2057
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Object recognition for semantic robot visionEngenharia de computadoresRobóticaVisão por computadorSemântica de computadoresReconhecimento de formasReconhecer todos os objectos presentes numa qualquer imagem do dia-a-dia será um importante contributo para a compreensão autónoma de imagens. Um agente inteligente para perceber todas as dinâmicas do conteúdo semântico precisa primeiramente de reconhecer cada objecto na cena. Contudo, a aprendizagem e o reconhecimento de objectos sem supervisão, con- tinuam a ser um dos grandes desafios na área da visão robótica. O nosso trabalho é uma abordagem transversal a este problema. Nós construímos um agente capaz de localizar, numa cena complexa, instâncias de categorias previamente requisitadas. Com o nome da categoria o agente procura autonomamente imagens representativas da categoria na Internet. Com estas imagens aprende sem supervisão a aparência da categoria. Após a fase de aprendizagem, o agente procura instâncias da categoria numa fotografia estática do cenário. Esta dissertação é orientada á detecção e ao reconhecimento de objectos numa cena complexa. São usados dois modelos para descrever os objectos: Scale Invariant Feature Transform (SIFT) e o descritor de forma proposto por Deb Kumar Roy. Para localizar diferentes objectos de interesse na cena efectuamos segmentação de cena baseada nas saliências de cor. Após localizado, extraímos o objecto da imagem através da análise dos seus contornos, para finalmente reconhece-lo através da combinação de vários métodos de classificação. ABSTRACT: Recognizing objects in an everyday scene is a major step in unsupervised image understanding. An intelligent agent needs to first identify each object in an environment scene, so it could eventually understand all the dynamics of the semantic content. However, unsupervised learning and unsupervised object recognition remains a great challenge in the vision research area. Our work is a transverse approach in unsupervised object learning and object recognition. We built an agent capable of locating, in a complex scene, an instance of a requested category. The name of a category is uploaded to the agent's system and it autonomously learns the category appearance, by searching the Internet and looking for category examples. Then it explores a static picture of the surrounding environment, looking for an instance of the previously learned category. This dissertation focus on the object detection and object recognition in a complex picture scene. We use Scale Invariant Feature Transform (SIFT) and Roy's Shape Representation (RSR) to represent an object, and an ensemble of several classification techniques to recognize an object. To obtain the object's location on the complex scene we used scene segmentation, based on image colour saliencies, and object extraction based on contour analysis.Universidade de Aveiro2011-04-19T13:51:49Z2008-01-01T00:00:00Z2008info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/2057engRibeiro, Luís Miguel Saraivainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-22T10:59:12Zoai:ria.ua.pt:10773/2057Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:40:36.245441Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Object recognition for semantic robot vision
title Object recognition for semantic robot vision
spellingShingle Object recognition for semantic robot vision
Ribeiro, Luís Miguel Saraiva
Engenharia de computadores
Robótica
Visão por computador
Semântica de computadores
Reconhecimento de formas
title_short Object recognition for semantic robot vision
title_full Object recognition for semantic robot vision
title_fullStr Object recognition for semantic robot vision
title_full_unstemmed Object recognition for semantic robot vision
title_sort Object recognition for semantic robot vision
author Ribeiro, Luís Miguel Saraiva
author_facet Ribeiro, Luís Miguel Saraiva
author_role author
dc.contributor.author.fl_str_mv Ribeiro, Luís Miguel Saraiva
dc.subject.por.fl_str_mv Engenharia de computadores
Robótica
Visão por computador
Semântica de computadores
Reconhecimento de formas
topic Engenharia de computadores
Robótica
Visão por computador
Semântica de computadores
Reconhecimento de formas
description Reconhecer todos os objectos presentes numa qualquer imagem do dia-a-dia será um importante contributo para a compreensão autónoma de imagens. Um agente inteligente para perceber todas as dinâmicas do conteúdo semântico precisa primeiramente de reconhecer cada objecto na cena. Contudo, a aprendizagem e o reconhecimento de objectos sem supervisão, con- tinuam a ser um dos grandes desafios na área da visão robótica. O nosso trabalho é uma abordagem transversal a este problema. Nós construímos um agente capaz de localizar, numa cena complexa, instâncias de categorias previamente requisitadas. Com o nome da categoria o agente procura autonomamente imagens representativas da categoria na Internet. Com estas imagens aprende sem supervisão a aparência da categoria. Após a fase de aprendizagem, o agente procura instâncias da categoria numa fotografia estática do cenário. Esta dissertação é orientada á detecção e ao reconhecimento de objectos numa cena complexa. São usados dois modelos para descrever os objectos: Scale Invariant Feature Transform (SIFT) e o descritor de forma proposto por Deb Kumar Roy. Para localizar diferentes objectos de interesse na cena efectuamos segmentação de cena baseada nas saliências de cor. Após localizado, extraímos o objecto da imagem através da análise dos seus contornos, para finalmente reconhece-lo através da combinação de vários métodos de classificação. ABSTRACT: Recognizing objects in an everyday scene is a major step in unsupervised image understanding. An intelligent agent needs to first identify each object in an environment scene, so it could eventually understand all the dynamics of the semantic content. However, unsupervised learning and unsupervised object recognition remains a great challenge in the vision research area. Our work is a transverse approach in unsupervised object learning and object recognition. We built an agent capable of locating, in a complex scene, an instance of a requested category. The name of a category is uploaded to the agent's system and it autonomously learns the category appearance, by searching the Internet and looking for category examples. Then it explores a static picture of the surrounding environment, looking for an instance of the previously learned category. This dissertation focus on the object detection and object recognition in a complex picture scene. We use Scale Invariant Feature Transform (SIFT) and Roy's Shape Representation (RSR) to represent an object, and an ensemble of several classification techniques to recognize an object. To obtain the object's location on the complex scene we used scene segmentation, based on image colour saliencies, and object extraction based on contour analysis.
publishDate 2008
dc.date.none.fl_str_mv 2008-01-01T00:00:00Z
2008
2011-04-19T13:51:49Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/2057
url http://hdl.handle.net/10773/2057
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade de Aveiro
publisher.none.fl_str_mv Universidade de Aveiro
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137454614118400