Binarização de imagens de documentos utilizando estimativa local de largura de traço

Detalhes bibliográficos
Autor(a) principal: ALMEIDA, Leandro Henrique Espindola Viana de
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/27741
Resumo: Este trabalho apresenta um novo método de binarização para imagens de documentos. O algoritmo proposto utiliza operações morfológicas, estimativas de background, estimativas de largura de traço e imagens de contraste para realizar a classificação dos pixels. A estratégia de estimativa da largura de traço também é uma novidade proposta por este trabalho, desenvolvida a partir de análises de outras estratégias utilizadas na literatura e disposta a suprir deficiências identificadas nessas outras metodologias. O algoritmo foi avaliado a partir dos critérios utilizados em competições internacionais de binarização de imagens de documentos, e seu desempenho foi comparado com outras técnicas clássicas e recentes, escolhidas de acordo com a semelhança de suas estratégias em relação à técnica aqui proposta. Todas as imagens utilizadas no trabalho possuem um padrão ouro – ground truth – associado, para aferição dos resultados. A qualidade da estimativa da largura de traço também foi analisada junto a outras formas de estimativa encontradas nos algoritmos utilizados nos experimentos. A análise geral dos resultados demonstra que o algoritmo apresentou melhor desempenho em imagens de documentos manuscritos, e um desempenho compatível com os demais quando atuando sobre imagens de documentos tipografados. A estimativa da largura de traço apresentou desempenho superior às demais estratégias utilizadas na comparação. A partir dos resultados, foi feita uma análise de caso, identificando pontos fortes e deficiências do algoritmo proposto, e possíveis aprimoramentos são sugeridos, no intuito de dar continuidade aos estudos nessa área, seguindo com o desenvolvimento da técnica para obtenção de melhores resultados.
id UFPE_03c5e0b95a2476694fb3417d05c79c45
oai_identifier_str oai:repositorio.ufpe.br:123456789/27741
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling ALMEIDA, Leandro Henrique Espindola Viana dehttp://lattes.cnpq.br/5131838458364191http://lattes.cnpq.br/2248591013863307MELLO, Carlos Alexandre Barros de2018-11-23T21:57:45Z2018-11-23T21:57:45Z2015-08-03https://repositorio.ufpe.br/handle/123456789/27741Este trabalho apresenta um novo método de binarização para imagens de documentos. O algoritmo proposto utiliza operações morfológicas, estimativas de background, estimativas de largura de traço e imagens de contraste para realizar a classificação dos pixels. A estratégia de estimativa da largura de traço também é uma novidade proposta por este trabalho, desenvolvida a partir de análises de outras estratégias utilizadas na literatura e disposta a suprir deficiências identificadas nessas outras metodologias. O algoritmo foi avaliado a partir dos critérios utilizados em competições internacionais de binarização de imagens de documentos, e seu desempenho foi comparado com outras técnicas clássicas e recentes, escolhidas de acordo com a semelhança de suas estratégias em relação à técnica aqui proposta. Todas as imagens utilizadas no trabalho possuem um padrão ouro – ground truth – associado, para aferição dos resultados. A qualidade da estimativa da largura de traço também foi analisada junto a outras formas de estimativa encontradas nos algoritmos utilizados nos experimentos. A análise geral dos resultados demonstra que o algoritmo apresentou melhor desempenho em imagens de documentos manuscritos, e um desempenho compatível com os demais quando atuando sobre imagens de documentos tipografados. A estimativa da largura de traço apresentou desempenho superior às demais estratégias utilizadas na comparação. A partir dos resultados, foi feita uma análise de caso, identificando pontos fortes e deficiências do algoritmo proposto, e possíveis aprimoramentos são sugeridos, no intuito de dar continuidade aos estudos nessa área, seguindo com o desenvolvimento da técnica para obtenção de melhores resultados.This paper proposes a new binarization method for document images. The proposed algorithm uses morphological operations, background estimation, stroke width estimation and contrast images to perform pixel classification. The strategy for estimating the stroke width is also a new proposal of this work, developed from studies of other strategies used in the literature and willing to meet shortcomings identified in these other methodologies. The algorithm was evaluated based on criteria used in international competitions of document images binarization, and its performance was compared to other classic and recent techniques, chosen according to the similarity of their strategies regarding the technique described. All images used in this study have a ground truth image associated, for measuring the results. The quality of the estimated stroke width was also evaluated alongside with other forms of estimations found in the literature. Overall results show that the algorithm performed better with the handwritten document images, and it has a compatible performance compared to others, acting on typewritten document images. The stroke width estimation method has superior performance to other strategies used in the comparison. From the results, a case study was made, identifying strengths and weaknesses of the proposed algorithm, and possible solutions are proposed in order to continue their studies in this area, following the development of the technique for better results.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProcessamento de imagensProcessamento de documentosLimiarizaçãoBinarizaçãoEstimativa de largura de traçoBinarização de imagens de documentos utilizando estimativa local de largura de traçoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.jpgDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.jpgGenerated Thumbnailimage/jpeg1248https://repositorio.ufpe.br/bitstream/123456789/27741/7/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.jpg1a00687241c1a5ada34dc9094439c420MD57ORIGINALDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdfDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdfapplication/pdf12354898https://repositorio.ufpe.br/bitstream/123456789/27741/1/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdfe501e3b7bee62acb68e2235e19c27bf8MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/27741/4/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/27741/5/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD55TEXTDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.txtDISSERTAÇÃO Leandro Henrique Espindola V de Almeida.pdf.txtExtracted texttext/plain273085https://repositorio.ufpe.br/bitstream/123456789/27741/6/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.txt00af90ee161a82b4dfa2d11ef657681aMD56123456789/277412019-10-26 01:56:19.131oai:repositorio.ufpe.br:123456789/27741TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T04:56:19Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Binarização de imagens de documentos utilizando estimativa local de largura de traço
title Binarização de imagens de documentos utilizando estimativa local de largura de traço
spellingShingle Binarização de imagens de documentos utilizando estimativa local de largura de traço
ALMEIDA, Leandro Henrique Espindola Viana de
Processamento de imagens
Processamento de documentos
Limiarização
Binarização
Estimativa de largura de traço
title_short Binarização de imagens de documentos utilizando estimativa local de largura de traço
title_full Binarização de imagens de documentos utilizando estimativa local de largura de traço
title_fullStr Binarização de imagens de documentos utilizando estimativa local de largura de traço
title_full_unstemmed Binarização de imagens de documentos utilizando estimativa local de largura de traço
title_sort Binarização de imagens de documentos utilizando estimativa local de largura de traço
author ALMEIDA, Leandro Henrique Espindola Viana de
author_facet ALMEIDA, Leandro Henrique Espindola Viana de
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/5131838458364191
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2248591013863307
dc.contributor.author.fl_str_mv ALMEIDA, Leandro Henrique Espindola Viana de
dc.contributor.advisor1.fl_str_mv MELLO, Carlos Alexandre Barros de
contributor_str_mv MELLO, Carlos Alexandre Barros de
dc.subject.por.fl_str_mv Processamento de imagens
Processamento de documentos
Limiarização
Binarização
Estimativa de largura de traço
topic Processamento de imagens
Processamento de documentos
Limiarização
Binarização
Estimativa de largura de traço
description Este trabalho apresenta um novo método de binarização para imagens de documentos. O algoritmo proposto utiliza operações morfológicas, estimativas de background, estimativas de largura de traço e imagens de contraste para realizar a classificação dos pixels. A estratégia de estimativa da largura de traço também é uma novidade proposta por este trabalho, desenvolvida a partir de análises de outras estratégias utilizadas na literatura e disposta a suprir deficiências identificadas nessas outras metodologias. O algoritmo foi avaliado a partir dos critérios utilizados em competições internacionais de binarização de imagens de documentos, e seu desempenho foi comparado com outras técnicas clássicas e recentes, escolhidas de acordo com a semelhança de suas estratégias em relação à técnica aqui proposta. Todas as imagens utilizadas no trabalho possuem um padrão ouro – ground truth – associado, para aferição dos resultados. A qualidade da estimativa da largura de traço também foi analisada junto a outras formas de estimativa encontradas nos algoritmos utilizados nos experimentos. A análise geral dos resultados demonstra que o algoritmo apresentou melhor desempenho em imagens de documentos manuscritos, e um desempenho compatível com os demais quando atuando sobre imagens de documentos tipografados. A estimativa da largura de traço apresentou desempenho superior às demais estratégias utilizadas na comparação. A partir dos resultados, foi feita uma análise de caso, identificando pontos fortes e deficiências do algoritmo proposto, e possíveis aprimoramentos são sugeridos, no intuito de dar continuidade aos estudos nessa área, seguindo com o desenvolvimento da técnica para obtenção de melhores resultados.
publishDate 2015
dc.date.issued.fl_str_mv 2015-08-03
dc.date.accessioned.fl_str_mv 2018-11-23T21:57:45Z
dc.date.available.fl_str_mv 2018-11-23T21:57:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/27741
url https://repositorio.ufpe.br/handle/123456789/27741
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/27741/7/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/27741/1/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf
https://repositorio.ufpe.br/bitstream/123456789/27741/4/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/27741/5/license.txt
https://repositorio.ufpe.br/bitstream/123456789/27741/6/DISSERTA%c3%87%c3%83O%20Leandro%20Henrique%20Espindola%20V%20de%20Almeida.pdf.txt
bitstream.checksum.fl_str_mv 1a00687241c1a5ada34dc9094439c420
e501e3b7bee62acb68e2235e19c27bf8
e39d27027a6cc9cb039ad269a5db8e34
4b8a02c7f2818eaf00dcf2260dd5eb08
00af90ee161a82b4dfa2d11ef657681a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310631860207616