Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/6026 |
Resumo: | O reconhecimento de estilos de escrita é uma etapa necessária para automatizar o reconhecimento fim de um sistema multi-estilos. A tarefa de reconhecimento de estilos de escrita é desafiadora devido a similaridade entre alguns estilos. Desta forma, o principal objetivo deste trabalho é realizar uma análise do reconhecimento de estilos de escrita em documentos manuscritos considerando técnicas robustas indiferente do estilo de escrita considerado. Comparamos duas abordagens para o reconhecimento de estilos de escrita, sendo que a primeira consiste na utilização dos descritores de textura GLCM, LBP, LPQ e SURF em conjunto com o classificador SVM, enquanto na segunda abordagem utilizaremos uma técnica de aprendizagem profunda descrita como Rede Neural Convolucional (CNN). Além da comparação, analisamos o impacto da quantidade de informação presente nos documentos manuscritos, a relação existente entre o número de classes (estilos de escrita) e a taxa de reconhecimento e o desempenho dos descritores de textura para esta abordagem. Avaliaremos ainda a importância do processo de compactação de escrita para esta aplicação. Experimentos foram realizados em uma base de dados com cinco classes, nos quais conseguimos taxas de acerto similares as apresentadas na literatura em ambas abordagens, a melhor taxa média de acerto foi de 98,48% utilizando o descritor de textura SURF a partir do documento original. Por meio dos experimentos realizados na primeira abordagem, concluímos que o ganho da compactação de escrita e divisão em blocos está estritamente relacionado ao descritor utilizado. Enquanto que para a segunda, na qual obtemos a melhor taxa média de 91,43%, chegamos a conclusão de que a utilização da compactação de escrita não possui grande impacto, desde que uma quantidade de informação suficiente seja fornecida. Mesmo que a segunda abordagem atingido taxas inferiores, ambas abordagens conseguem taxas de acerto relevantes para o problema. |
id |
UTFPR-12_def1a845089a8551030dafadb505c403 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/6026 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-09T19:10:32Z2020-11-09T19:10:32Z2015-12-02SOUZA, Marcos Roberto e. Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos. 2015. 37 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2015.http://repositorio.utfpr.edu.br/jspui/handle/1/6026porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOEscrita - IdentificaçãoSistemas de reconhecimento de padrõesAprendizado do computadorInteligência artificialWriting - IdentificationPattern recognition systemsMachine learningArtificial intelligenceUma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisO reconhecimento de estilos de escrita é uma etapa necessária para automatizar o reconhecimento fim de um sistema multi-estilos. A tarefa de reconhecimento de estilos de escrita é desafiadora devido a similaridade entre alguns estilos. Desta forma, o principal objetivo deste trabalho é realizar uma análise do reconhecimento de estilos de escrita em documentos manuscritos considerando técnicas robustas indiferente do estilo de escrita considerado. Comparamos duas abordagens para o reconhecimento de estilos de escrita, sendo que a primeira consiste na utilização dos descritores de textura GLCM, LBP, LPQ e SURF em conjunto com o classificador SVM, enquanto na segunda abordagem utilizaremos uma técnica de aprendizagem profunda descrita como Rede Neural Convolucional (CNN). Além da comparação, analisamos o impacto da quantidade de informação presente nos documentos manuscritos, a relação existente entre o número de classes (estilos de escrita) e a taxa de reconhecimento e o desempenho dos descritores de textura para esta abordagem. Avaliaremos ainda a importância do processo de compactação de escrita para esta aplicação. Experimentos foram realizados em uma base de dados com cinco classes, nos quais conseguimos taxas de acerto similares as apresentadas na literatura em ambas abordagens, a melhor taxa média de acerto foi de 98,48% utilizando o descritor de textura SURF a partir do documento original. Por meio dos experimentos realizados na primeira abordagem, concluímos que o ganho da compactação de escrita e divisão em blocos está estritamente relacionado ao descritor utilizado. Enquanto que para a segunda, na qual obtemos a melhor taxa média de 91,43%, chegamos a conclusão de que a utilização da compactação de escrita não possui grande impacto, desde que uma quantidade de informação suficiente seja fornecida. Mesmo que a segunda abordagem atingido taxas inferiores, ambas abordagens conseguem taxas de acerto relevantes para o problema.Campo MourãoGonçalves, Diego BertoliniGonçalves, Diego BertoliniBorsato, Frank HelbertValentin, Lucio GeronimoAlencar, Aretha BarbosaSouza, Marcos Roberto einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRTEXTCM_COCIC_2015_2_01.pdf.txtExtracted texttext/plain86263http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/1/CM_COCIC_2015_2_01.pdf.txtdabb52a50b56fe4fae9b82d806bcaa8dMD51THUMBNAILCM_COCIC_2015_2_01.pdf.jpgGenerated Thumbnailimage/jpeg1342http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/2/CM_COCIC_2015_2_01.pdf.jpg9aa18b39915aa1d73b1b80ac013d2ed5MD52ORIGINALCM_COCIC_2015_2_01.pdfapplication/pdf1637683http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/3/CM_COCIC_2015_2_01.pdfbaa819e7588989de628e729de7f16219MD53LICENSElicense.txttext/plain1291http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/4/license.txtdfb14e53a8c6b76b85e77d7a5a3b3809MD541/60262020-11-09 17:10:32.812oai:repositorio.utfpr.edu.br:1/6026IE5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBwdWJsaWNhw6fDo28sIGF1dG9yaXpvIGEgVVRGUFIgYSB2ZWljdWxhciwgCmF0cmF2w6lzIGRvIFBvcnRhbCBkZSBJbmZvcm1hw6fDo28gZW0gQWNlc3NvIEFiZXJ0byAoUElBQSkgZSBkb3MgQ2F0w6Fsb2dvcyBkYXMgQmlibGlvdGVjYXMgCmRlc3RhIEluc3RpdHVpw6fDo28sIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBubyA5LjYxMC85OCwgCm8gdGV4dG8gZGVzdGEgb2JyYSwgb2JzZXJ2YW5kbyBhcyBjb25kacOnw7VlcyBkZSBkaXNwb25pYmlsaXphw6fDo28gcmVnaXN0cmFkYXMgbm8gaXRlbSA0IGRvIArigJxUZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgUHVibGljYcOnw6NvIGRlIFRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgCkVzcGVjaWFsaXphw6fDo28sIERpc3NlcnRhw6fDtWVzIGUgVGVzZXMgbm8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyAKU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBkYSBVVEZQUuKAnSwgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCwgdmlzYW5kbyBhIApkaXZ1bGdhw6fDo28gZGEgcHJvZHXDp8OjbyBjaWVudMOtZmljYSBicmFzaWxlaXJhLgoKICBBcyB2aWFzIG9yaWdpbmFpcyBlIGFzc2luYWRhcyBwZWxvKHMpIGF1dG9yKGVzKSBkbyDigJxUZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgUHVibGljYcOnw6NvIGRlIApUcmFiYWxob3MgZGUgQ29uY2x1c8OjbyBkZSBDdXJzbyBkZSBHcmFkdWHDp8OjbyBlIEVzcGVjaWFsaXphw6fDo28sIERpc3NlcnRhw6fDtWVzIGUgVGVzZXMgbm8gUG9ydGFsIApkZSBJbmZvcm1hw6fDo28gZSBub3MgQ2F0w6Fsb2dvcyBFbGV0csO0bmljb3MgZG8gU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBkYSBVVEZQUuKAnSBlIGRhIOKAnERlY2xhcmHDp8OjbyAKZGUgQXV0b3JpYeKAnSBlbmNvbnRyYW0tc2UgYXJxdWl2YWRhcyBuYSBCaWJsaW90ZWNhIGRvIEPDom1wdXMgbm8gcXVhbCBvIHRyYWJhbGhvIGZvaSBkZWZlbmRpZG8uIApObyBjYXNvIGRlIHB1YmxpY2HDp8O1ZXMgZGUgYXV0b3JpYSBjb2xldGl2YSBlIG11bHRpY8OibXB1cywgb3MgZG9jdW1lbnRvcyBmaWNhcsOjbyBzb2IgZ3VhcmRhIGRhIApCaWJsaW90ZWNhIGNvbSBhIHF1YWwgbyDigJxwcmltZWlybyBhdXRvcuKAnSBwb3NzdWEgdsOtbmN1bG8uCg==Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:32Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos |
title |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos |
spellingShingle |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos Souza, Marcos Roberto e CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Escrita - Identificação Sistemas de reconhecimento de padrões Aprendizado do computador Inteligência artificial Writing - Identification Pattern recognition systems Machine learning Artificial intelligence |
title_short |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos |
title_full |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos |
title_fullStr |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos |
title_full_unstemmed |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos |
title_sort |
Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos |
author |
Souza, Marcos Roberto e |
author_facet |
Souza, Marcos Roberto e |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Gonçalves, Diego Bertolini |
dc.contributor.referee1.fl_str_mv |
Gonçalves, Diego Bertolini |
dc.contributor.referee2.fl_str_mv |
Borsato, Frank Helbert |
dc.contributor.referee3.fl_str_mv |
Valentin, Lucio Geronimo |
dc.contributor.referee4.fl_str_mv |
Alencar, Aretha Barbosa |
dc.contributor.author.fl_str_mv |
Souza, Marcos Roberto e |
contributor_str_mv |
Gonçalves, Diego Bertolini Gonçalves, Diego Bertolini Borsato, Frank Helbert Valentin, Lucio Geronimo Alencar, Aretha Barbosa |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Escrita - Identificação Sistemas de reconhecimento de padrões Aprendizado do computador Inteligência artificial Writing - Identification Pattern recognition systems Machine learning Artificial intelligence |
dc.subject.por.fl_str_mv |
Escrita - Identificação Sistemas de reconhecimento de padrões Aprendizado do computador Inteligência artificial Writing - Identification Pattern recognition systems Machine learning Artificial intelligence |
description |
O reconhecimento de estilos de escrita é uma etapa necessária para automatizar o reconhecimento fim de um sistema multi-estilos. A tarefa de reconhecimento de estilos de escrita é desafiadora devido a similaridade entre alguns estilos. Desta forma, o principal objetivo deste trabalho é realizar uma análise do reconhecimento de estilos de escrita em documentos manuscritos considerando técnicas robustas indiferente do estilo de escrita considerado. Comparamos duas abordagens para o reconhecimento de estilos de escrita, sendo que a primeira consiste na utilização dos descritores de textura GLCM, LBP, LPQ e SURF em conjunto com o classificador SVM, enquanto na segunda abordagem utilizaremos uma técnica de aprendizagem profunda descrita como Rede Neural Convolucional (CNN). Além da comparação, analisamos o impacto da quantidade de informação presente nos documentos manuscritos, a relação existente entre o número de classes (estilos de escrita) e a taxa de reconhecimento e o desempenho dos descritores de textura para esta abordagem. Avaliaremos ainda a importância do processo de compactação de escrita para esta aplicação. Experimentos foram realizados em uma base de dados com cinco classes, nos quais conseguimos taxas de acerto similares as apresentadas na literatura em ambas abordagens, a melhor taxa média de acerto foi de 98,48% utilizando o descritor de textura SURF a partir do documento original. Por meio dos experimentos realizados na primeira abordagem, concluímos que o ganho da compactação de escrita e divisão em blocos está estritamente relacionado ao descritor utilizado. Enquanto que para a segunda, na qual obtemos a melhor taxa média de 91,43%, chegamos a conclusão de que a utilização da compactação de escrita não possui grande impacto, desde que uma quantidade de informação suficiente seja fornecida. Mesmo que a segunda abordagem atingido taxas inferiores, ambas abordagens conseguem taxas de acerto relevantes para o problema. |
publishDate |
2015 |
dc.date.issued.fl_str_mv |
2015-12-02 |
dc.date.accessioned.fl_str_mv |
2020-11-09T19:10:32Z |
dc.date.available.fl_str_mv |
2020-11-09T19:10:32Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SOUZA, Marcos Roberto e. Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos. 2015. 37 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2015. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/6026 |
identifier_str_mv |
SOUZA, Marcos Roberto e. Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos. 2015. 37 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2015. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/6026 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento Acadêmico de Computação |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/1/CM_COCIC_2015_2_01.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/2/CM_COCIC_2015_2_01.pdf.jpg http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/3/CM_COCIC_2015_2_01.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/4/license.txt |
bitstream.checksum.fl_str_mv |
dabb52a50b56fe4fae9b82d806bcaa8d 9aa18b39915aa1d73b1b80ac013d2ed5 baa819e7588989de628e729de7f16219 dfb14e53a8c6b76b85e77d7a5a3b3809 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1805923230070865920 |