Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.

Detalhes bibliográficos
Autor(a) principal: Mesquita, Rafael Galvão de
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
Texto Completo: https://repositorio.ufpe.br/handle/123456789/12357
Resumo: Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de documento deve estar de um observador de forma que a região de texto e pequenos detalhes não sejam mais percebidos, restando assim somente seu background. Para simular o modo como percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto como parte do algoritmo. O método proposto foi testado em duas bases de imagens de documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles. Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método de melhores resultados no caso geral.
id UFPE_03dab67145c73c9dda9bc3e025ac9f38
oai_identifier_str oai:repositorio.ufpe.br:123456789/12357
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling Mesquita, Rafael Galvão deMello, Carlos Alexandre Barros de 2015-03-13T12:54:54Z2015-03-13T12:54:54Z2013-02-27https://repositorio.ufpe.br/handle/123456789/12357Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de documento deve estar de um observador de forma que a região de texto e pequenos detalhes não sejam mais percebidos, restando assim somente seu background. Para simular o modo como percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto como parte do algoritmo. O método proposto foi testado em duas bases de imagens de documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles. Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método de melhores resultados no caso geral.CNPQporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProcessamento de Imagens Documentos HistóricosLimiarizaçãoSegmentação de ImagensPercepção VisualUm algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDissertacao Rafael Mesquita.pdf.jpgDissertacao Rafael Mesquita.pdf.jpgGenerated Thumbnailimage/jpeg1348https://repositorio.ufpe.br/bitstream/123456789/12357/5/Dissertacao%20Rafael%20Mesquita.pdf.jpg39689859df9ea887453ff5e9426c386aMD55ORIGINALDissertacao Rafael Mesquita.pdfDissertacao Rafael Mesquita.pdfDissertação de mestradoapplication/pdf3995191https://repositorio.ufpe.br/bitstream/123456789/12357/1/Dissertacao%20Rafael%20Mesquita.pdf5535bd266c779130b6cdd14898d96405MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.ufpe.br/bitstream/123456789/12357/2/license_rdf66e71c371cc565284e70f40736c94386MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/12357/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDissertacao Rafael Mesquita.pdf.txtDissertacao Rafael Mesquita.pdf.txtExtracted texttext/plain133325https://repositorio.ufpe.br/bitstream/123456789/12357/4/Dissertacao%20Rafael%20Mesquita.pdf.txtf31cbb2a4990d07f4b46be2291edc63dMD54123456789/123572019-10-25 04:49:40.415oai:repositorio.ufpe.br:123456789/12357TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T07:49:40Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
title Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
spellingShingle Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
Mesquita, Rafael Galvão de
Processamento de Imagens Documentos Históricos
Limiarização
Segmentação de Imagens
Percepção Visual
title_short Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
title_full Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
title_fullStr Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
title_full_unstemmed Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
title_sort Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
author Mesquita, Rafael Galvão de
author_facet Mesquita, Rafael Galvão de
author_role author
dc.contributor.author.fl_str_mv Mesquita, Rafael Galvão de
dc.contributor.advisor1.fl_str_mv Mello, Carlos Alexandre Barros de
contributor_str_mv Mello, Carlos Alexandre Barros de
dc.subject.por.fl_str_mv Processamento de Imagens Documentos Históricos
Limiarização
Segmentação de Imagens
Percepção Visual
topic Processamento de Imagens Documentos Históricos
Limiarização
Segmentação de Imagens
Percepção Visual
description Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de documento deve estar de um observador de forma que a região de texto e pequenos detalhes não sejam mais percebidos, restando assim somente seu background. Para simular o modo como percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto como parte do algoritmo. O método proposto foi testado em duas bases de imagens de documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles. Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método de melhores resultados no caso geral.
publishDate 2013
dc.date.issued.fl_str_mv 2013-02-27
dc.date.accessioned.fl_str_mv 2015-03-13T12:54:54Z
dc.date.available.fl_str_mv 2015-03-13T12:54:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/12357
url https://repositorio.ufpe.br/handle/123456789/12357
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/12357/5/Dissertacao%20Rafael%20Mesquita.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/12357/1/Dissertacao%20Rafael%20Mesquita.pdf
https://repositorio.ufpe.br/bitstream/123456789/12357/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/12357/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/12357/4/Dissertacao%20Rafael%20Mesquita.pdf.txt
bitstream.checksum.fl_str_mv 39689859df9ea887453ff5e9426c386a
5535bd266c779130b6cdd14898d96405
66e71c371cc565284e70f40736c94386
4b8a02c7f2818eaf00dcf2260dd5eb08
f31cbb2a4990d07f4b46be2291edc63d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802310775028580352