Reconhecimento de texto e rastreamento de objetos 2D/3D
Autor(a) principal: | |
---|---|
Data de Publicação: | 2012 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
Texto Completo: | https://hdl.handle.net/20.500.12733/1617582 |
Resumo: | Orientadores: Jorge Stolfi, Neucimar Jerônimo Leite |
id |
UNICAMP-30_c316933f074238f4e79ad4d0b6ca7cba |
---|---|
oai_identifier_str |
oai::854836 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Reconhecimento de texto e rastreamento de objetos 2D/3DText recognition and 2D/3D object trackingReconhecimento de textoDetecção de textoDescritor de imagemRastreamento de textoRastreamento tridimensionalText recognitionText detectionImage descriptorText trackingThree-dimensional trackingOrientadores: Jorge Stolfi, Neucimar Jerônimo LeiteTese (doutorado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Nesta tese abordamos três problemas de visão computacional: (1) detecção e reconhecimento de objetos de texto planos em imagens de cenas reais; (2) rastreamento destes objetos de texto em vídeos digitais; e (3) o rastreamento de um objeto tridimensional rígido arbitrário com marcas conhecidas em um vídeo digital. Nós desenvolvemos, para cada um dos problemas, algoritmos inovadores, que são pelo menos tão precisos e robustos quanto outros algoritmos estado-da-arte. Especificamente, para reconhecimento de texto nós desenvolvemos (e validamos extensivamente) um novo descritor de imagem baseado em HOG especializado para escrita romana, que denominamos T-HOG, e mostramos sua contribuição como um filtro em um detector de texto (SNOOPERTEXT). Nós também melhoramos o algoritmo SNOOPERTEXT através do uso da técnica multiescala para tratar caracteres de tamanhos bastante variados e limitar a sensibilidade do algoritmo a vários artefatos. Para rastreamento de texto, nós descrevemos quatro estratégias básicas para combinar a detecção e o rastreamento de texto, e desenvolvemos também um rastreador específico baseado em filtro de partículas que explora o uso do reconhecedor T-HOG. Para o rastreamento de objetos rígidos, nós desenvolvemos um novo algoritmo preciso e robusto (AFFTRACK) que combina rastreamento de características por KLT com uma calibração de câmera melhorada. Nós testamos extensivamente nossos algoritmos com diversas bases de dados descritas na literatura. Nós também desenvolvemos algumas bases de dados (publicamente disponíveis) para a validação de algoritmos de detecção e rastreamento de texto e de rastreamento de objetos rígidos em vídeosAbstract: In this thesis we address three computer vision problems: (1) the detection and recognition of flat text objects in images of real scenes; (2) the tracking of such text objects in a digital video; and (3) the tracking an arbitrary three-dimensional rigid object with known markings in a digital video. For each problem we developed innovative algorithms, which are at least as accurate and robust as other state-of-the-art algorithms. Specifically, for text classification we developed (and extensively evaluated) a new HOG-based descriptor specialized for Roman script, which we call T-HOG, and showed its value as a post-filter for an existing text detector (SNOOPERTEXT). We also improved the SNOOPERTEXT algorithm by using the multi-scale technique to handle widely different letter sizes while limiting the sensitivity of the algorithm to various artifacts. For text tracking, we describe four basic ways of combining a text detector and a text tracker, and we developed a specific tracker based on a particle-filter which exploits the T-HOG recognizer. For rigid object tracking we developed a new accurate and robust algorithm (AFFTRACK) that combines the KLT feature tracker with an improved camera calibration procedure. We extensively tested our algorithms on several benchmarks well-known in the literature. We also created benchmarks (publicly available) for the evaluation of text detection and tracking and rigid object tracking algorithmsDoutoradoCiência da ComputaçãoDoutor em Ciência da Computação[s.n.]Stolfi, Jorge, 1950-Leite, Neucimar Jerônimo, 1961-2016Cord, MatthieuAraújo, Arnaldo de AlbuquerquePérez, PatrickDetyniecki, MarcinUniversidade Estadual de Campinas (UNICAMP). Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASMinetto, Rodrigo, 1983-2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf155 p. : il.https://hdl.handle.net/20.500.12733/1617582MINETTO, Rodrigo. Reconhecimento de texto e rastreamento de objetos 2D/3D. 2012. 155 p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1617582. Acesso em: 3 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/854836porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T06:35:26Zoai::854836Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T06:35:26Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Reconhecimento de texto e rastreamento de objetos 2D/3D Text recognition and 2D/3D object tracking |
title |
Reconhecimento de texto e rastreamento de objetos 2D/3D |
spellingShingle |
Reconhecimento de texto e rastreamento de objetos 2D/3D Minetto, Rodrigo, 1983- Reconhecimento de texto Detecção de texto Descritor de imagem Rastreamento de texto Rastreamento tridimensional Text recognition Text detection Image descriptor Text tracking Three-dimensional tracking |
title_short |
Reconhecimento de texto e rastreamento de objetos 2D/3D |
title_full |
Reconhecimento de texto e rastreamento de objetos 2D/3D |
title_fullStr |
Reconhecimento de texto e rastreamento de objetos 2D/3D |
title_full_unstemmed |
Reconhecimento de texto e rastreamento de objetos 2D/3D |
title_sort |
Reconhecimento de texto e rastreamento de objetos 2D/3D |
author |
Minetto, Rodrigo, 1983- |
author_facet |
Minetto, Rodrigo, 1983- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Stolfi, Jorge, 1950- Leite, Neucimar Jerônimo, 1961-2016 Cord, Matthieu Araújo, Arnaldo de Albuquerque Pérez, Patrick Detyniecki, Marcin Universidade Estadual de Campinas (UNICAMP). Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Minetto, Rodrigo, 1983- |
dc.subject.por.fl_str_mv |
Reconhecimento de texto Detecção de texto Descritor de imagem Rastreamento de texto Rastreamento tridimensional Text recognition Text detection Image descriptor Text tracking Three-dimensional tracking |
topic |
Reconhecimento de texto Detecção de texto Descritor de imagem Rastreamento de texto Rastreamento tridimensional Text recognition Text detection Image descriptor Text tracking Three-dimensional tracking |
description |
Orientadores: Jorge Stolfi, Neucimar Jerônimo Leite |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1617582 MINETTO, Rodrigo. Reconhecimento de texto e rastreamento de objetos 2D/3D. 2012. 155 p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1617582. Acesso em: 3 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1617582 |
identifier_str_mv |
MINETTO, Rodrigo. Reconhecimento de texto e rastreamento de objetos 2D/3D. 2012. 155 p. Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1617582. Acesso em: 3 set. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/854836 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 155 p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189075381387264 |