Reconhecimento de texto e rastreamento de objetos 2D/3D

Detalhes bibliográficos
Autor(a) principal: Minetto, Rodrigo, 1983-
Data de Publicação: 2012
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Texto Completo: https://hdl.handle.net/20.500.12733/1617582
Resumo: Orientadores: Jorge Stolfi, Neucimar Jerônimo Leite
id UNICAMP-30_c316933f074238f4e79ad4d0b6ca7cba
oai_identifier_str oai::854836
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Reconhecimento de texto e rastreamento de objetos 2D/3DText recognition and 2D/3D object trackingReconhecimento de textoDetecção de textoDescritor de imagemRastreamento de textoRastreamento tridimensionalText recognitionText detectionImage descriptorText trackingThree-dimensional trackingOrientadores: Jorge Stolfi, Neucimar Jerônimo LeiteTese (doutorado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Nesta tese abordamos três problemas de visão computacional: (1) detecção e reconhecimento de objetos de texto planos em imagens de cenas reais; (2) rastreamento destes objetos de texto em vídeos digitais; e (3) o rastreamento de um objeto tridimensional rígido arbitrário com marcas conhecidas em um vídeo digital. Nós desenvolvemos, para cada um dos problemas, algoritmos inovadores, que são pelo menos tão precisos e robustos quanto outros algoritmos estado-da-arte. Especificamente, para reconhecimento de texto nós desenvolvemos (e validamos extensivamente) um novo descritor de imagem baseado em HOG especializado para escrita romana, que denominamos T-HOG, e mostramos sua contribuição como um filtro em um detector de texto (SNOOPERTEXT). Nós também melhoramos o algoritmo SNOOPERTEXT através do uso da técnica multiescala para tratar caracteres de tamanhos bastante variados e limitar a sensibilidade do algoritmo a vários artefatos. Para rastreamento de texto, nós descrevemos quatro estratégias básicas para combinar a detecção e o rastreamento de texto, e desenvolvemos também um rastreador específico baseado em filtro de partículas que explora o uso do reconhecedor T-HOG. Para o rastreamento de objetos rígidos, nós desenvolvemos um novo algoritmo preciso e robusto (AFFTRACK) que combina rastreamento de características por KLT com uma calibração de câmera melhorada. Nós testamos extensivamente nossos algoritmos com diversas bases de dados descritas na literatura. Nós também desenvolvemos algumas bases de dados (publicamente disponíveis) para a validação de algoritmos de detecção e rastreamento de texto e de rastreamento de objetos rígidos em vídeosAbstract: In this thesis we address three computer vision problems: (1) the detection and recognition of flat text objects in images of real scenes; (2) the tracking of such text objects in a digital video; and (3) the tracking an arbitrary three-dimensional rigid object with known markings in a digital video. For each problem we developed innovative algorithms, which are at least as accurate and robust as other state-of-the-art algorithms. Specifically, for text classification we developed (and extensively evaluated) a new HOG-based descriptor specialized for Roman script, which we call T-HOG, and showed its value as a post-filter for an existing text detector (SNOOPERTEXT). We also improved the SNOOPERTEXT algorithm by using the multi-scale technique to handle widely different letter sizes while limiting the sensitivity of the algorithm to various artifacts. For text tracking, we describe four basic ways of combining a text detector and a text tracker, and we developed a specific tracker based on a particle-filter which exploits the T-HOG recognizer. For rigid object tracking we developed a new accurate and robust algorithm (AFFTRACK) that combines the KLT feature tracker with an improved camera calibration procedure. We extensively tested our algorithms on several benchmarks well-known in the literature. We also created benchmarks (publicly available) for the evaluation of text detection and tracking and rigid object tracking algorithmsDoutoradoCiência da ComputaçãoDoutor em Ciência da Computação[s.n.]Stolfi, Jorge, 1950-Leite, Neucimar Jerônimo, 1961-2016Cord, MatthieuAraújo, Arnaldo de AlbuquerquePérez, PatrickDetyniecki, MarcinUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASMinetto, Rodrigo, 1983-2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf155 p. : il.https://hdl.handle.net/20.500.12733/1617582MINETTO, Rodrigo. Reconhecimento de texto e rastreamento de objetos 2D/3D. 2012. 155 p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1617582. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/854836porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:35:26Zoai::854836Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:35:26Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Reconhecimento de texto e rastreamento de objetos 2D/3D
Text recognition and 2D/3D object tracking
title Reconhecimento de texto e rastreamento de objetos 2D/3D
spellingShingle Reconhecimento de texto e rastreamento de objetos 2D/3D
Minetto, Rodrigo, 1983-
Reconhecimento de texto
Detecção de texto
Descritor de imagem
Rastreamento de texto
Rastreamento tridimensional
Text recognition
Text detection
Image descriptor
Text tracking
Three-dimensional tracking
title_short Reconhecimento de texto e rastreamento de objetos 2D/3D
title_full Reconhecimento de texto e rastreamento de objetos 2D/3D
title_fullStr Reconhecimento de texto e rastreamento de objetos 2D/3D
title_full_unstemmed Reconhecimento de texto e rastreamento de objetos 2D/3D
title_sort Reconhecimento de texto e rastreamento de objetos 2D/3D
author Minetto, Rodrigo, 1983-
author_facet Minetto, Rodrigo, 1983-
author_role author
dc.contributor.none.fl_str_mv Stolfi, Jorge, 1950-
Leite, Neucimar Jerônimo, 1961-2016
Cord, Matthieu
Araújo, Arnaldo de Albuquerque
Pérez, Patrick
Detyniecki, Marcin
Universidade Estadual de Campinas (UNICAMP). Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Minetto, Rodrigo, 1983-
dc.subject.por.fl_str_mv Reconhecimento de texto
Detecção de texto
Descritor de imagem
Rastreamento de texto
Rastreamento tridimensional
Text recognition
Text detection
Image descriptor
Text tracking
Three-dimensional tracking
topic Reconhecimento de texto
Detecção de texto
Descritor de imagem
Rastreamento de texto
Rastreamento tridimensional
Text recognition
Text detection
Image descriptor
Text tracking
Three-dimensional tracking
description Orientadores: Jorge Stolfi, Neucimar Jerônimo Leite
publishDate 2012
dc.date.none.fl_str_mv 2012
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1617582
MINETTO, Rodrigo. Reconhecimento de texto e rastreamento de objetos 2D/3D. 2012. 155 p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1617582. Acesso em: 3 set. 2024.
url https://hdl.handle.net/20.500.12733/1617582
identifier_str_mv MINETTO, Rodrigo. Reconhecimento de texto e rastreamento de objetos 2D/3D. 2012. 155 p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1617582. Acesso em: 3 set. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/854836
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
155 p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189075381387264