Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2013 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/12357 |
Resumo: | Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de documento deve estar de um observador de forma que a região de texto e pequenos detalhes não sejam mais percebidos, restando assim somente seu background. Para simular o modo como percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto como parte do algoritmo. O método proposto foi testado em duas bases de imagens de documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles. Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método de melhores resultados no caso geral. |
id |
UFPE_03dab67145c73c9dda9bc3e025ac9f38 |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/12357 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
Mesquita, Rafael Galvão deMello, Carlos Alexandre Barros de 2015-03-13T12:54:54Z2015-03-13T12:54:54Z2013-02-27https://repositorio.ufpe.br/handle/123456789/12357Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de documento deve estar de um observador de forma que a região de texto e pequenos detalhes não sejam mais percebidos, restando assim somente seu background. Para simular o modo como percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto como parte do algoritmo. O método proposto foi testado em duas bases de imagens de documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles. Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método de melhores resultados no caso geral.CNPQporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessProcessamento de Imagens Documentos HistóricosLimiarizaçãoSegmentação de ImagensPercepção VisualUm algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDissertacao Rafael Mesquita.pdf.jpgDissertacao Rafael Mesquita.pdf.jpgGenerated Thumbnailimage/jpeg1348https://repositorio.ufpe.br/bitstream/123456789/12357/5/Dissertacao%20Rafael%20Mesquita.pdf.jpg39689859df9ea887453ff5e9426c386aMD55ORIGINALDissertacao Rafael Mesquita.pdfDissertacao Rafael Mesquita.pdfDissertação de mestradoapplication/pdf3995191https://repositorio.ufpe.br/bitstream/123456789/12357/1/Dissertacao%20Rafael%20Mesquita.pdf5535bd266c779130b6cdd14898d96405MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.ufpe.br/bitstream/123456789/12357/2/license_rdf66e71c371cc565284e70f40736c94386MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/12357/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDissertacao Rafael Mesquita.pdf.txtDissertacao Rafael Mesquita.pdf.txtExtracted texttext/plain133325https://repositorio.ufpe.br/bitstream/123456789/12357/4/Dissertacao%20Rafael%20Mesquita.pdf.txtf31cbb2a4990d07f4b46be2291edc63dMD54123456789/123572019-10-25 04:49:40.415oai:repositorio.ufpe.br:123456789/12357TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T07:49:40Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. |
title |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. |
spellingShingle |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. Mesquita, Rafael Galvão de Processamento de Imagens Documentos Históricos Limiarização Segmentação de Imagens Percepção Visual |
title_short |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. |
title_full |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. |
title_fullStr |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. |
title_full_unstemmed |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. |
title_sort |
Um algoritmo de limiarização para imagens de documentos baseado na percepção de objetos a distância. |
author |
Mesquita, Rafael Galvão de |
author_facet |
Mesquita, Rafael Galvão de |
author_role |
author |
dc.contributor.author.fl_str_mv |
Mesquita, Rafael Galvão de |
dc.contributor.advisor1.fl_str_mv |
Mello, Carlos Alexandre Barros de |
contributor_str_mv |
Mello, Carlos Alexandre Barros de |
dc.subject.por.fl_str_mv |
Processamento de Imagens Documentos Históricos Limiarização Segmentação de Imagens Percepção Visual |
topic |
Processamento de Imagens Documentos Históricos Limiarização Segmentação de Imagens Percepção Visual |
description |
Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de documento deve estar de um observador de forma que a região de texto e pequenos detalhes não sejam mais percebidos, restando assim somente seu background. Para simular o modo como percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto como parte do algoritmo. O método proposto foi testado em duas bases de imagens de documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles. Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método de melhores resultados no caso geral. |
publishDate |
2013 |
dc.date.issued.fl_str_mv |
2013-02-27 |
dc.date.accessioned.fl_str_mv |
2015-03-13T12:54:54Z |
dc.date.available.fl_str_mv |
2015-03-13T12:54:54Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/12357 |
url |
https://repositorio.ufpe.br/handle/123456789/12357 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/12357/5/Dissertacao%20Rafael%20Mesquita.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/12357/1/Dissertacao%20Rafael%20Mesquita.pdf https://repositorio.ufpe.br/bitstream/123456789/12357/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/12357/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/12357/4/Dissertacao%20Rafael%20Mesquita.pdf.txt |
bitstream.checksum.fl_str_mv |
39689859df9ea887453ff5e9426c386a 5535bd266c779130b6cdd14898d96405 66e71c371cc565284e70f40736c94386 4b8a02c7f2818eaf00dcf2260dd5eb08 f31cbb2a4990d07f4b46be2291edc63d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310775028580352 |