Detecção de inclinação em imagens de documentos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/2269 |
Resumo: | A digitalizaçao de documentos contribui para a preservação da informação evitando a sua perda devido à degradação física do papel. Atualmente, Sistemas de Reconhecimento Automático de Documentos são empregados para converter automaticamente a informação contida nas imagens em texto editável de forma rápida e sem a necessidade da presença de um indivíduo, tornando essa informação pesquisável através, por exemplo, de palavras-chave. A inclinação em documentos é um problema frequente nesses sistemas e, em geral, é imposta durante a digitalização, quando o papel é posicionado com um ângulo diferente de 0 grau sobre o eixo do scanner. No caso de documentos manuscritos, a inclinação pode surgir durante a escrita do próprio documento, principalmente quando o escritor não tem uma linha de pauta como guia. A correção da inclinação é essencial para o bom desempenho desses sistemas de reconhecimento automático. Este trabalho aborda o problema da detecção de inclinação em documentos impressos e manuscritos, trazendo uma revisão dos principais métodos para detecção de inclinação. Dois novos algoritmos para detecção de inclinação que se baseiam na modelagem de um documento como um conjunto de objetos retangulares são apresentados: um destinado à detecção do ângulo de um documento com caracteres impressos e outro destinado à detecção de múltipla inclinação em documentos manuscritos. O algoritmo para documentos impressos apresentado visa superar problemas comuns nas técnicas já divulgadas na literatura, como o alto custo computacional e a vulnerabilidade à presença de figuras, tabelas e ruído no documento. O desempenho dos algoritmos propostos é avaliado sobre várias bases de imagens contendo diversos tipos de documentos. Resultados experimentais comparando a técnica proposta para documentos impressos com outros métodos clássicos mostram o desempenho superior em termos de taxa de acerto da detecção do ângulo de inclinação e em termos de tempo computacional da técnica proposta. Experimentos com o algoritmo destinado à detecção de múltipla inclinação em texto manuscrito mostram que este presentou resultados bastante satisfatórios na detecção do ângulo de documentos reais escritos por vários indivíduos |
id |
UFPE_fa88b8dbf73f1e0d2287b081bb4e7188 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/2269 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
MASCARO, Angélica AlcoforadoCAVALCANTI, George Darmiton da Cunha2014-06-12T15:56:01Z2014-06-12T15:56:01Z2010-01-31Alcoforado Mascaro, Angélica; Darmiton da Cunha Cavalcanti, George. Detecção de inclinação em imagens de documentos. 2010. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010.https://repositorio.ufpe.br/handle/123456789/2269A digitalizaçao de documentos contribui para a preservação da informação evitando a sua perda devido à degradação física do papel. Atualmente, Sistemas de Reconhecimento Automático de Documentos são empregados para converter automaticamente a informação contida nas imagens em texto editável de forma rápida e sem a necessidade da presença de um indivíduo, tornando essa informação pesquisável através, por exemplo, de palavras-chave. A inclinação em documentos é um problema frequente nesses sistemas e, em geral, é imposta durante a digitalização, quando o papel é posicionado com um ângulo diferente de 0 grau sobre o eixo do scanner. No caso de documentos manuscritos, a inclinação pode surgir durante a escrita do próprio documento, principalmente quando o escritor não tem uma linha de pauta como guia. A correção da inclinação é essencial para o bom desempenho desses sistemas de reconhecimento automático. Este trabalho aborda o problema da detecção de inclinação em documentos impressos e manuscritos, trazendo uma revisão dos principais métodos para detecção de inclinação. Dois novos algoritmos para detecção de inclinação que se baseiam na modelagem de um documento como um conjunto de objetos retangulares são apresentados: um destinado à detecção do ângulo de um documento com caracteres impressos e outro destinado à detecção de múltipla inclinação em documentos manuscritos. O algoritmo para documentos impressos apresentado visa superar problemas comuns nas técnicas já divulgadas na literatura, como o alto custo computacional e a vulnerabilidade à presença de figuras, tabelas e ruído no documento. O desempenho dos algoritmos propostos é avaliado sobre várias bases de imagens contendo diversos tipos de documentos. Resultados experimentais comparando a técnica proposta para documentos impressos com outros métodos clássicos mostram o desempenho superior em termos de taxa de acerto da detecção do ângulo de inclinação e em termos de tempo computacional da técnica proposta. Experimentos com o algoritmo destinado à detecção de múltipla inclinação em texto manuscrito mostram que este presentou resultados bastante satisfatórios na detecção do ângulo de documentos reais escritos por vários indivíduosConselho Nacional de Desenvolvimento Científico e TecnológicoporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessDetecção de inclinação em documentosDocumentos manuscritosProcessamento de imagensDetecção de inclinação em imagens de documentosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILarquivo2383_1.pdf.jpgarquivo2383_1.pdf.jpgGenerated Thumbnailimage/jpeg1267https://repositorio.ufpe.br/bitstream/123456789/2269/4/arquivo2383_1.pdf.jpg6031b104c8c33306488c9de599d2a1d5MD54ORIGINALarquivo2383_1.pdfapplication/pdf8598930https://repositorio.ufpe.br/bitstream/123456789/2269/1/arquivo2383_1.pdfcfcc980fd439436057917fc8beecb3f9MD51LICENSElicense.txttext/plain1748https://repositorio.ufpe.br/bitstream/123456789/2269/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTarquivo2383_1.pdf.txtarquivo2383_1.pdf.txtExtracted texttext/plain118386https://repositorio.ufpe.br/bitstream/123456789/2269/3/arquivo2383_1.pdf.txtc36bd95242b22e5da8e98b38d8ba9ad7MD53123456789/22692019-10-25 18:37:30.577oai:repositorio.ufpe.br:123456789/2269Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T21:37:30Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Detecção de inclinação em imagens de documentos |
title |
Detecção de inclinação em imagens de documentos |
spellingShingle |
Detecção de inclinação em imagens de documentos MASCARO, Angélica Alcoforado Detecção de inclinação em documentos Documentos manuscritos Processamento de imagens |
title_short |
Detecção de inclinação em imagens de documentos |
title_full |
Detecção de inclinação em imagens de documentos |
title_fullStr |
Detecção de inclinação em imagens de documentos |
title_full_unstemmed |
Detecção de inclinação em imagens de documentos |
title_sort |
Detecção de inclinação em imagens de documentos |
author |
MASCARO, Angélica Alcoforado |
author_facet |
MASCARO, Angélica Alcoforado |
author_role |
author |
dc.contributor.author.fl_str_mv |
MASCARO, Angélica Alcoforado |
dc.contributor.advisor1.fl_str_mv |
CAVALCANTI, George Darmiton da Cunha |
contributor_str_mv |
CAVALCANTI, George Darmiton da Cunha |
dc.subject.por.fl_str_mv |
Detecção de inclinação em documentos Documentos manuscritos Processamento de imagens |
topic |
Detecção de inclinação em documentos Documentos manuscritos Processamento de imagens |
description |
A digitalizaçao de documentos contribui para a preservação da informação evitando a sua perda devido à degradação física do papel. Atualmente, Sistemas de Reconhecimento Automático de Documentos são empregados para converter automaticamente a informação contida nas imagens em texto editável de forma rápida e sem a necessidade da presença de um indivíduo, tornando essa informação pesquisável através, por exemplo, de palavras-chave. A inclinação em documentos é um problema frequente nesses sistemas e, em geral, é imposta durante a digitalização, quando o papel é posicionado com um ângulo diferente de 0 grau sobre o eixo do scanner. No caso de documentos manuscritos, a inclinação pode surgir durante a escrita do próprio documento, principalmente quando o escritor não tem uma linha de pauta como guia. A correção da inclinação é essencial para o bom desempenho desses sistemas de reconhecimento automático. Este trabalho aborda o problema da detecção de inclinação em documentos impressos e manuscritos, trazendo uma revisão dos principais métodos para detecção de inclinação. Dois novos algoritmos para detecção de inclinação que se baseiam na modelagem de um documento como um conjunto de objetos retangulares são apresentados: um destinado à detecção do ângulo de um documento com caracteres impressos e outro destinado à detecção de múltipla inclinação em documentos manuscritos. O algoritmo para documentos impressos apresentado visa superar problemas comuns nas técnicas já divulgadas na literatura, como o alto custo computacional e a vulnerabilidade à presença de figuras, tabelas e ruído no documento. O desempenho dos algoritmos propostos é avaliado sobre várias bases de imagens contendo diversos tipos de documentos. Resultados experimentais comparando a técnica proposta para documentos impressos com outros métodos clássicos mostram o desempenho superior em termos de taxa de acerto da detecção do ângulo de inclinação e em termos de tempo computacional da técnica proposta. Experimentos com o algoritmo destinado à detecção de múltipla inclinação em texto manuscrito mostram que este presentou resultados bastante satisfatórios na detecção do ângulo de documentos reais escritos por vários indivíduos |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010-01-31 |
dc.date.accessioned.fl_str_mv |
2014-06-12T15:56:01Z |
dc.date.available.fl_str_mv |
2014-06-12T15:56:01Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
Alcoforado Mascaro, Angélica; Darmiton da Cunha Cavalcanti, George. Detecção de inclinação em imagens de documentos. 2010. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010. |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/2269 |
identifier_str_mv |
Alcoforado Mascaro, Angélica; Darmiton da Cunha Cavalcanti, George. Detecção de inclinação em imagens de documentos. 2010. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2010. |
url |
https://repositorio.ufpe.br/handle/123456789/2269 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/2269/4/arquivo2383_1.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/2269/1/arquivo2383_1.pdf https://repositorio.ufpe.br/bitstream/123456789/2269/2/license.txt https://repositorio.ufpe.br/bitstream/123456789/2269/3/arquivo2383_1.pdf.txt |
bitstream.checksum.fl_str_mv |
6031b104c8c33306488c9de599d2a1d5 cfcc980fd439436057917fc8beecb3f9 8a4605be74aa9ea9d79846c1fba20a33 c36bd95242b22e5da8e98b38d8ba9ad7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310834666340352 |