Binarização de imagens de documentos utilizando estimativa local de largura de traço
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/27741 |
Resumo: | Este trabalho apresenta um novo método de binarização para imagens de documentos. O algoritmo proposto utiliza operações morfológicas, estimativas de background, estimativas de largura de traço e imagens de contraste para realizar a classificação dos pixels. A estratégia de estimativa da largura de traço também é uma novidade proposta por este trabalho, desenvolvida a partir de análises de outras estratégias utilizadas na literatura e disposta a suprir deficiências identificadas nessas outras metodologias. O algoritmo foi avaliado a partir dos critérios utilizados em competições internacionais de binarização de imagens de documentos, e seu desempenho foi comparado com outras técnicas clássicas e recentes, escolhidas de acordo com a semelhança de suas estratégias em relação à técnica aqui proposta. Todas as imagens utilizadas no trabalho possuem um padrão ouro – ground truth – associado, para aferição dos resultados. A qualidade da estimativa da largura de traço também foi analisada junto a outras formas de estimativa encontradas nos algoritmos utilizados nos experimentos. A análise geral dos resultados demonstra que o algoritmo apresentou melhor desempenho em imagens de documentos manuscritos, e um desempenho compatível com os demais quando atuando sobre imagens de documentos tipografados. A estimativa da largura de traço apresentou desempenho superior às demais estratégias utilizadas na comparação. A partir dos resultados, foi feita uma análise de caso, identificando pontos fortes e deficiências do algoritmo proposto, e possíveis aprimoramentos são sugeridos, no intuito de dar continuidade aos estudos nessa área, seguindo com o desenvolvimento da técnica para obtenção de melhores resultados. |
id |
UFPE_03c5e0b95a2476694fb3417d05c79c45 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/27741 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
ALMEIDA, Leandro Henrique Espindola Viana dehttp://lattes.cnpq.br/5131838458364191http://lattes.cnpq.br/2248591013863307MELLO, Carlos Alexandre Barros de2018-11-23T21:57:45Z2018-11-23T21:57:45Z2015-08-03https://repositorio.ufpe.br/handle/123456789/27741Este trabalho apresenta um novo método de binarização para imagens de documentos. O algoritmo proposto utiliza operações morfológicas, estimativas de background, estimativas de largura de traço e imagens de contraste para realizar a classificação dos pixels. A estratégia de estimativa da largura de traço também é uma novidade proposta por este trabalho, desenvolvida a partir de análises de outras estratégias utilizadas na literatura e disposta a suprir deficiências identificadas nessas outras metodologias. O algoritmo foi avaliado a partir dos critérios utilizados em competições internacionais de binarização de imagens de documentos, e seu desempenho foi comparado com outras técnicas clássicas e recentes, escolhidas de acordo com a semelhança de suas estratégias em relação à técnica aqui proposta. Todas as imagens utilizadas no trabalho possuem um padrão ouro – ground truth – associado, para aferição dos resultados. A qualidade da estimativa da largura de traço também foi analisada junto a outras formas de estimativa encontradas nos algoritmos utilizados nos experimentos. A análise geral dos resultados demonstra que o algoritmo apresentou melhor desempenho em imagens de documentos manuscritos, e um desempenho compatível com os demais quando atuando sobre imagens de documentos tipografados. A estimativa da largura de traço apresentou desempenho superior às demais estratégias utilizadas na comparação. A partir dos resultados, foi feita uma análise de caso, identificando pontos fortes e deficiências do algoritmo proposto, e possíveis aprimoramentos são sugeridos, no intuito de dar continuidade aos estudos nessa área, seguindo com o desenvolvimento da técnica para obtenção de melhores resultados.This paper proposes a new binarization method for document images. The proposed algorithm uses morphological operations, background estimation, stroke width estimation and contrast images to perform pixel classification. The strategy for estimating the stroke width is also a new proposal of this work, developed from studies of other strategies used in the literature and willing to meet shortcomings identified in these other methodologies. The algorithm was evaluated based on criteria used in international competitions of document images binarization, and its performance was compared to other classic and recent techniques, chosen according to the similarity of their strategies regarding the technique described. All images used in this study have a ground truth image associated, for measuring the results. The quality of the estimated stroke width was also evaluated alongside with other forms of estimations found in the literature. Overall results show that the algorithm performed better with the handwritten document images, and it has a compatible performance compared to others, acting on typewritten document images. The stroke width estimation method has superior performance to other strategies used in the comparison. From the results, a case study was made, identifying strengths and weaknesses of the proposed algorithm, and possible solutions are proposed in order to continue their studies in this area, following the development of the technique for better results.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProcessamento de imagensProcessamento de documentosLimiarizaçãoBinarizaçãoEstimativa de largura de traçoBinarização de imagens de documentos utilizando estimativa local de largura de traçoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.jpgDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.jpgGenerated Thumbnailimage/jpeg1248https://repositorio.ufpe.br/bitstream/123456789/27741/7/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.jpg1a00687241c1a5ada34dc9094439c420MD57ORIGINALDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdfDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdfapplication/pdf12354898https://repositorio.ufpe.br/bitstream/123456789/27741/1/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdfe501e3b7bee62acb68e2235e19c27bf8MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/27741/4/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/27741/5/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD55TEXTDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.txtDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.txtExtracted texttext/plain273085https://repositorio.ufpe.br/bitstream/123456789/27741/6/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.txt00af90ee161a82b4dfa2d11ef657681aMD56123456789/277412019-10-26 01:56:19.131oai:repositorio.ufpe.br:123456789/27741TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T04:56:19Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Binarização de imagens de documentos utilizando estimativa local de largura de traço |
title |
Binarização de imagens de documentos utilizando estimativa local de largura de traço |
spellingShingle |
Binarização de imagens de documentos utilizando estimativa local de largura de traço ALMEIDA, Leandro Henrique Espindola Viana de Processamento de imagens Processamento de documentos Limiarização Binarização Estimativa de largura de traço |
title_short |
Binarização de imagens de documentos utilizando estimativa local de largura de traço |
title_full |
Binarização de imagens de documentos utilizando estimativa local de largura de traço |
title_fullStr |
Binarização de imagens de documentos utilizando estimativa local de largura de traço |
title_full_unstemmed |
Binarização de imagens de documentos utilizando estimativa local de largura de traço |
title_sort |
Binarização de imagens de documentos utilizando estimativa local de largura de traço |
author |
ALMEIDA, Leandro Henrique Espindola Viana de |
author_facet |
ALMEIDA, Leandro Henrique Espindola Viana de |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/5131838458364191 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2248591013863307 |
dc.contributor.author.fl_str_mv |
ALMEIDA, Leandro Henrique Espindola Viana de |
dc.contributor.advisor1.fl_str_mv |
MELLO, Carlos Alexandre Barros de |
contributor_str_mv |
MELLO, Carlos Alexandre Barros de |
dc.subject.por.fl_str_mv |
Processamento de imagens Processamento de documentos Limiarização Binarização Estimativa de largura de traço |
topic |
Processamento de imagens Processamento de documentos Limiarização Binarização Estimativa de largura de traço |
description |
Este trabalho apresenta um novo método de binarização para imagens de documentos. O algoritmo proposto utiliza operações morfológicas, estimativas de background, estimativas de largura de traço e imagens de contraste para realizar a classificação dos pixels. A estratégia de estimativa da largura de traço também é uma novidade proposta por este trabalho, desenvolvida a partir de análises de outras estratégias utilizadas na literatura e disposta a suprir deficiências identificadas nessas outras metodologias. O algoritmo foi avaliado a partir dos critérios utilizados em competições internacionais de binarização de imagens de documentos, e seu desempenho foi comparado com outras técnicas clássicas e recentes, escolhidas de acordo com a semelhança de suas estratégias em relação à técnica aqui proposta. Todas as imagens utilizadas no trabalho possuem um padrão ouro – ground truth – associado, para aferição dos resultados. A qualidade da estimativa da largura de traço também foi analisada junto a outras formas de estimativa encontradas nos algoritmos utilizados nos experimentos. A análise geral dos resultados demonstra que o algoritmo apresentou melhor desempenho em imagens de documentos manuscritos, e um desempenho compatível com os demais quando atuando sobre imagens de documentos tipografados. A estimativa da largura de traço apresentou desempenho superior às demais estratégias utilizadas na comparação. A partir dos resultados, foi feita uma análise de caso, identificando pontos fortes e deficiências do algoritmo proposto, e possíveis aprimoramentos são sugeridos, no intuito de dar continuidade aos estudos nessa área, seguindo com o desenvolvimento da técnica para obtenção de melhores resultados. |
publishDate |
2015 |
dc.date.issued.fl_str_mv |
2015-08-03 |
dc.date.accessioned.fl_str_mv |
2018-11-23T21:57:45Z |
dc.date.available.fl_str_mv |
2018-11-23T21:57:45Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/27741 |
url |
https://repositorio.ufpe.br/handle/123456789/27741 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/27741/7/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/27741/1/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf https://repositorio.ufpe.br/bitstream/123456789/27741/4/license_rdf https://repositorio.ufpe.br/bitstream/123456789/27741/5/license.txt https://repositorio.ufpe.br/bitstream/123456789/27741/6/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.txt |
bitstream.checksum.fl_str_mv |
1a00687241c1a5ada34dc9094439c420 e501e3b7bee62acb68e2235e19c27bf8 e39d27027a6cc9cb039ad269a5db8e34 4b8a02c7f2818eaf00dcf2260dd5eb08 00af90ee161a82b4dfa2d11ef657681a |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310631860207616 |