Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres

Detalhes bibliográficos
Autor(a) principal: Ferreira Alves, Neide
Data de Publicação: 2008
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300000c9md
Texto Completo: https://repositorio.ufpe.br/handle/123456789/5603
Resumo: Para avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Óptico de Caracteres (OCR) é necessário adquirir métricas para avaliar o quanto um texto transcrito está próximo do texto original, uma vez que quando uma imagem sofre alterações, por menores que sejam, estas influenciam nas transcrições dos OCR s. Neste trabalho será apresentada uma nova métrica para avaliar transcrições de OCR s: através da aplicação de técnicas de filtragem (brilho, contraste, resolução, rotação, etc.) na imagem original, para que as mudanças mínimas gerem inúmeras imagens, as quais serão submetidas ao OCR e resultarão em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas até a igualdade entre os caracteres. Através da análise de maior freqüência entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito próximo do original com um índice de acerto maior que os arquivos transcritos sem o processo de filtragem
id UFPE_bf5ca355cecc8095c7f617f420b06c82
oai_identifier_str oai:repositorio.ufpe.br:123456789/5603
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling Ferreira Alves, NeideDueire Lins, Rafael 2014-06-12T17:40:35Z2014-06-12T17:40:35Z2008-01-31Ferreira Alves, Neide; Dueire Lins, Rafael. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Pernambuco, Recife, 2008.https://repositorio.ufpe.br/handle/123456789/5603ark:/64986/001300000c9mdPara avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Óptico de Caracteres (OCR) é necessário adquirir métricas para avaliar o quanto um texto transcrito está próximo do texto original, uma vez que quando uma imagem sofre alterações, por menores que sejam, estas influenciam nas transcrições dos OCR s. Neste trabalho será apresentada uma nova métrica para avaliar transcrições de OCR s: através da aplicação de técnicas de filtragem (brilho, contraste, resolução, rotação, etc.) na imagem original, para que as mudanças mínimas gerem inúmeras imagens, as quais serão submetidas ao OCR e resultarão em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas até a igualdade entre os caracteres. Através da análise de maior freqüência entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito próximo do original com um índice de acerto maior que os arquivos transcritos sem o processo de filtragemporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessOCRReconhecimento de PadrõesProcessamento de ImagensEstratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILarquivo7036_1.pdf.jpgarquivo7036_1.pdf.jpgGenerated Thumbnailimage/jpeg1191https://repositorio.ufpe.br/bitstream/123456789/5603/4/arquivo7036_1.pdf.jpg7f57da7ba27e8502bcffe8df88930eb5MD54ORIGINALarquivo7036_1.pdfapplication/pdf2047609https://repositorio.ufpe.br/bitstream/123456789/5603/1/arquivo7036_1.pdfe3d87bd28e5314c857de9b11d1bc348aMD51LICENSElicense.txttext/plain1748https://repositorio.ufpe.br/bitstream/123456789/5603/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTarquivo7036_1.pdf.txtarquivo7036_1.pdf.txtExtracted texttext/plain257920https://repositorio.ufpe.br/bitstream/123456789/5603/3/arquivo7036_1.pdf.txta107326e012ebfb422548c5555ce1d7bMD53123456789/56032019-10-25 11:56:51.29oai:repositorio.ufpe.br:123456789/5603Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T14:56:51Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
spellingShingle Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
Ferreira Alves, Neide
OCR
Reconhecimento de Padrões
Processamento de Imagens
title_short Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_full Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_fullStr Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_full_unstemmed Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_sort Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
author Ferreira Alves, Neide
author_facet Ferreira Alves, Neide
author_role author
dc.contributor.author.fl_str_mv Ferreira Alves, Neide
dc.contributor.advisor1.fl_str_mv Dueire Lins, Rafael
contributor_str_mv Dueire Lins, Rafael
dc.subject.por.fl_str_mv OCR
Reconhecimento de Padrões
Processamento de Imagens
topic OCR
Reconhecimento de Padrões
Processamento de Imagens
description Para avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Óptico de Caracteres (OCR) é necessário adquirir métricas para avaliar o quanto um texto transcrito está próximo do texto original, uma vez que quando uma imagem sofre alterações, por menores que sejam, estas influenciam nas transcrições dos OCR s. Neste trabalho será apresentada uma nova métrica para avaliar transcrições de OCR s: através da aplicação de técnicas de filtragem (brilho, contraste, resolução, rotação, etc.) na imagem original, para que as mudanças mínimas gerem inúmeras imagens, as quais serão submetidas ao OCR e resultarão em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas até a igualdade entre os caracteres. Através da análise de maior freqüência entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito próximo do original com um índice de acerto maior que os arquivos transcritos sem o processo de filtragem
publishDate 2008
dc.date.issued.fl_str_mv 2008-01-31
dc.date.accessioned.fl_str_mv 2014-06-12T17:40:35Z
dc.date.available.fl_str_mv 2014-06-12T17:40:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Ferreira Alves, Neide; Dueire Lins, Rafael. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Pernambuco, Recife, 2008.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/5603
dc.identifier.dark.fl_str_mv ark:/64986/001300000c9md
identifier_str_mv Ferreira Alves, Neide; Dueire Lins, Rafael. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Pernambuco, Recife, 2008.
ark:/64986/001300000c9md
url https://repositorio.ufpe.br/handle/123456789/5603
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/5603/4/arquivo7036_1.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/5603/1/arquivo7036_1.pdf
https://repositorio.ufpe.br/bitstream/123456789/5603/2/license.txt
https://repositorio.ufpe.br/bitstream/123456789/5603/3/arquivo7036_1.pdf.txt
bitstream.checksum.fl_str_mv 7f57da7ba27e8502bcffe8df88930eb5
e3d87bd28e5314c857de9b11d1bc348a
8a4605be74aa9ea9d79846c1fba20a33
a107326e012ebfb422548c5555ce1d7b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1815172787054051328