Detecção Automática de Texto em Sequências de Vídeo

Detalhes bibliográficos
Autor(a) principal: Nereu, Inês Daniela Cunha
Data de Publicação: 2012
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/99677
Resumo: Dissertação de Mestrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
id RCAP_9ead4fd4565543ee92a304d843f61527
oai_identifier_str oai:estudogeral.uc.pt:10316/99677
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Detecção Automática de Texto em Sequências de VídeoTransformada Wavelet de HaarTransformada de Fourierdetecção de contornosalgoritmo de classificação K-médiaseliminação de falsos positivosclassificação de framesHaar Wavelet TransformFourier Transformedge analysisk-means clusteringfalse positive eliminationtext frames classificationDissertação de Mestrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.A detecção de texto é importante uma vez que permite obter informação relevante em imagens digitais, video, bases de dados e páginas web. Contudo, a sua detecção é bastante desafiante uma vez que o texto está frequentemente integrado num fundo complexo. São propostos três métodos para detectar tanto texto gráfico como texto de cena em frames de video. O primeiro baseia-se na Transformada Wavelet de Haar com a decomposição nível um nas sub-bandas LL, HL e HH onde são computadas um conjunto de características que vão alimentar o algoritmo k-médias para classificar as zonas de texto e as sem texto. A média das sub-bandas da Wavelet de Haar e a imagem binária resultante do k-médias permitem a classificação dos pixeis de texto. Os blocos de texto são segmentados com base na análise das projecções horizontais e verticais. Finalmente é introduzido um método para eliminação dos falsos positivos baseado nos contornos intrínsecos e extrínsecos. O segundo método é baseado na Transformada de Fourier no espaço de cores RGB. Neste método as características são calculadas sobre a FT nas sub-bandas R, G e B as quais são passadas enquanto argumento para o algoritmo k-médias e as restantes fases são iguais às do método anterior. O terceiro método detecta contornos para obter o mapa dos contornos nas direcções horizontal, vertical, diagonal direita para cima e diagonal esquerda para cima. Em seguida, as características são calculadas sobre os quatro mapas de contornos para serem o argumento do algoritmo de classificação k-médias. As restantes fases são iguais às dos dois métodos resumidos anteriormente. Por último foi ainda implementado um método de classificação de frames através de três regras formuladas com base no comportamento dos contornos para identificar frames de texto. Todos os métodos foram testados para uma variedade de imagens incluindo imagens com baixo contraste, diferentes fontes e distintos tamanhos de caracteres. Os resultados experimentais demonstram um melhor desempenho para o primeiro método.Text detection is important in the retrieval of texts from digital pictures, video, databases and WebPages. However, it can be very challenging since the text is often embedded in a complex background. I propose three methods for both graphics and scene text detection in video frames. The first is based on Haar Wavelet Transform, this method uses Wavelet single level decomposition LL, HL and HH sub bands for computing features and the computed features are fed to k-means clustering to classify the text pixel from the background of the image. The average of the Wavelet sub bands and the output of k-means clustering helps in classifying true text pixel in the image. The text blocks are detected based on analysis of projection profiles. Finally I introduce a method based on intrinsic and extrinsic edges to eliminate the false positives. The second method is based on Fourier Transform (FT) in RGB space and the features are computed over Fourier Transform on R,G and B sub bands to be fed to k-means, the rest of the steps are like the ones of the first method. The third method applies edge detection to get four edge maps in horizontal, vertical, up-right and up-left direction. Secondly the features are extracted from four edge maps to be fed to k-means. The rest of the steps are also like the ones of the first and second methods. Moreover a text frame classification is proposed based on three visual rules of the edges to indentify a true text frame. The robustness of all the methods is tested by conducting experiments on a variety of images of low contrast, different fonts and size of text in the image. The experimental results show that Haar Wavelet Transform outperforms the other methods.2012-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/99677http://hdl.handle.net/10316/99677porNereu, Inês Daniela Cunhainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T09:48:36Zoai:estudogeral.uc.pt:10316/99677Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:17:14.115152Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Detecção Automática de Texto em Sequências de Vídeo
title Detecção Automática de Texto em Sequências de Vídeo
spellingShingle Detecção Automática de Texto em Sequências de Vídeo
Nereu, Inês Daniela Cunha
Transformada Wavelet de Haar
Transformada de Fourier
detecção de contornos
algoritmo de classificação K-médias
eliminação de falsos positivos
classificação de frames
Haar Wavelet Transform
Fourier Transform
edge analysis
k-means clustering
false positive elimination
text frames classification
title_short Detecção Automática de Texto em Sequências de Vídeo
title_full Detecção Automática de Texto em Sequências de Vídeo
title_fullStr Detecção Automática de Texto em Sequências de Vídeo
title_full_unstemmed Detecção Automática de Texto em Sequências de Vídeo
title_sort Detecção Automática de Texto em Sequências de Vídeo
author Nereu, Inês Daniela Cunha
author_facet Nereu, Inês Daniela Cunha
author_role author
dc.contributor.author.fl_str_mv Nereu, Inês Daniela Cunha
dc.subject.por.fl_str_mv Transformada Wavelet de Haar
Transformada de Fourier
detecção de contornos
algoritmo de classificação K-médias
eliminação de falsos positivos
classificação de frames
Haar Wavelet Transform
Fourier Transform
edge analysis
k-means clustering
false positive elimination
text frames classification
topic Transformada Wavelet de Haar
Transformada de Fourier
detecção de contornos
algoritmo de classificação K-médias
eliminação de falsos positivos
classificação de frames
Haar Wavelet Transform
Fourier Transform
edge analysis
k-means clustering
false positive elimination
text frames classification
description Dissertação de Mestrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
publishDate 2012
dc.date.none.fl_str_mv 2012-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/99677
http://hdl.handle.net/10316/99677
url http://hdl.handle.net/10316/99677
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134067560546304