Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos

Detalhes bibliográficos
Autor(a) principal: Souza, Marcos Roberto e
Data de Publicação: 2015
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/6026
Resumo: O reconhecimento de estilos de escrita é uma etapa necessária para automatizar o reconhecimento fim de um sistema multi-estilos. A tarefa de reconhecimento de estilos de escrita é desafiadora devido a similaridade entre alguns estilos. Desta forma, o principal objetivo deste trabalho é realizar uma análise do reconhecimento de estilos de escrita em documentos manuscritos considerando técnicas robustas indiferente do estilo de escrita considerado. Comparamos duas abordagens para o reconhecimento de estilos de escrita, sendo que a primeira consiste na utilização dos descritores de textura GLCM, LBP, LPQ e SURF em conjunto com o classificador SVM, enquanto na segunda abordagem utilizaremos uma técnica de aprendizagem profunda descrita como Rede Neural Convolucional (CNN). Além da comparação, analisamos o impacto da quantidade de informação presente nos documentos manuscritos, a relação existente entre o número de classes (estilos de escrita) e a taxa de reconhecimento e o desempenho dos descritores de textura para esta abordagem. Avaliaremos ainda a importância do processo de compactação de escrita para esta aplicação. Experimentos foram realizados em uma base de dados com cinco classes, nos quais conseguimos taxas de acerto similares as apresentadas na literatura em ambas abordagens, a melhor taxa média de acerto foi de 98,48% utilizando o descritor de textura SURF a partir do documento original. Por meio dos experimentos realizados na primeira abordagem, concluímos que o ganho da compactação de escrita e divisão em blocos está estritamente relacionado ao descritor utilizado. Enquanto que para a segunda, na qual obtemos a melhor taxa média de 91,43%, chegamos a conclusão de que a utilização da compactação de escrita não possui grande impacto, desde que uma quantidade de informação suficiente seja fornecida. Mesmo que a segunda abordagem atingido taxas inferiores, ambas abordagens conseguem taxas de acerto relevantes para o problema.
id UTFPR-12_def1a845089a8551030dafadb505c403
oai_identifier_str oai:repositorio.utfpr.edu.br:1/6026
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-09T19:10:32Z2020-11-09T19:10:32Z2015-12-02SOUZA, Marcos Roberto e. Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos. 2015. 37 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2015.http://repositorio.utfpr.edu.br/jspui/handle/1/6026porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOEscrita - IdentificaçãoSistemas de reconhecimento de padrõesAprendizado do computadorInteligência artificialWriting - IdentificationPattern recognition systemsMachine learningArtificial intelligenceUma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisO reconhecimento de estilos de escrita é uma etapa necessária para automatizar o reconhecimento fim de um sistema multi-estilos. A tarefa de reconhecimento de estilos de escrita é desafiadora devido a similaridade entre alguns estilos. Desta forma, o principal objetivo deste trabalho é realizar uma análise do reconhecimento de estilos de escrita em documentos manuscritos considerando técnicas robustas indiferente do estilo de escrita considerado. Comparamos duas abordagens para o reconhecimento de estilos de escrita, sendo que a primeira consiste na utilização dos descritores de textura GLCM, LBP, LPQ e SURF em conjunto com o classificador SVM, enquanto na segunda abordagem utilizaremos uma técnica de aprendizagem profunda descrita como Rede Neural Convolucional (CNN). Além da comparação, analisamos o impacto da quantidade de informação presente nos documentos manuscritos, a relação existente entre o número de classes (estilos de escrita) e a taxa de reconhecimento e o desempenho dos descritores de textura para esta abordagem. Avaliaremos ainda a importância do processo de compactação de escrita para esta aplicação. Experimentos foram realizados em uma base de dados com cinco classes, nos quais conseguimos taxas de acerto similares as apresentadas na literatura em ambas abordagens, a melhor taxa média de acerto foi de 98,48% utilizando o descritor de textura SURF a partir do documento original. Por meio dos experimentos realizados na primeira abordagem, concluímos que o ganho da compactação de escrita e divisão em blocos está estritamente relacionado ao descritor utilizado. Enquanto que para a segunda, na qual obtemos a melhor taxa média de 91,43%, chegamos a conclusão de que a utilização da compactação de escrita não possui grande impacto, desde que uma quantidade de informação suficiente seja fornecida. Mesmo que a segunda abordagem atingido taxas inferiores, ambas abordagens conseguem taxas de acerto relevantes para o problema.Campo MourãoGonçalves, Diego BertoliniGonçalves, Diego BertoliniBorsato, Frank HelbertValentin, Lucio GeronimoAlencar, Aretha BarbosaSouza, Marcos Roberto einfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRTEXTCM_COCIC_2015_2_01.pdf.txtExtracted texttext/plain86263http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/1/CM_COCIC_2015_2_01.pdf.txtdabb52a50b56fe4fae9b82d806bcaa8dMD51THUMBNAILCM_COCIC_2015_2_01.pdf.jpgGenerated Thumbnailimage/jpeg1342http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/2/CM_COCIC_2015_2_01.pdf.jpg9aa18b39915aa1d73b1b80ac013d2ed5MD52ORIGINALCM_COCIC_2015_2_01.pdfapplication/pdf1637683http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/3/CM_COCIC_2015_2_01.pdfbaa819e7588989de628e729de7f16219MD53LICENSElicense.txttext/plain1291http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/4/license.txtdfb14e53a8c6b76b85e77d7a5a3b3809MD541/60262020-11-09 17:10:32.812oai:repositorio.utfpr.edu.br:1/6026IE5hIHF1YWxpZGFkZSBkZSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBkYSBwdWJsaWNhw6fDo28sIGF1dG9yaXpvIGEgVVRGUFIgYSB2ZWljdWxhciwgCmF0cmF2w6lzIGRvIFBvcnRhbCBkZSBJbmZvcm1hw6fDo28gZW0gQWNlc3NvIEFiZXJ0byAoUElBQSkgZSBkb3MgQ2F0w6Fsb2dvcyBkYXMgQmlibGlvdGVjYXMgCmRlc3RhIEluc3RpdHVpw6fDo28sIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgZGUgYWNvcmRvIGNvbSBhIExlaSBubyA5LjYxMC85OCwgCm8gdGV4dG8gZGVzdGEgb2JyYSwgb2JzZXJ2YW5kbyBhcyBjb25kacOnw7VlcyBkZSBkaXNwb25pYmlsaXphw6fDo28gcmVnaXN0cmFkYXMgbm8gaXRlbSA0IGRvIArigJxUZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgUHVibGljYcOnw6NvIGRlIFRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgCkVzcGVjaWFsaXphw6fDo28sIERpc3NlcnRhw6fDtWVzIGUgVGVzZXMgbm8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyAKU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBkYSBVVEZQUuKAnSwgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCwgdmlzYW5kbyBhIApkaXZ1bGdhw6fDo28gZGEgcHJvZHXDp8OjbyBjaWVudMOtZmljYSBicmFzaWxlaXJhLgoKICBBcyB2aWFzIG9yaWdpbmFpcyBlIGFzc2luYWRhcyBwZWxvKHMpIGF1dG9yKGVzKSBkbyDigJxUZXJtbyBkZSBBdXRvcml6YcOnw6NvIHBhcmEgUHVibGljYcOnw6NvIGRlIApUcmFiYWxob3MgZGUgQ29uY2x1c8OjbyBkZSBDdXJzbyBkZSBHcmFkdWHDp8OjbyBlIEVzcGVjaWFsaXphw6fDo28sIERpc3NlcnRhw6fDtWVzIGUgVGVzZXMgbm8gUG9ydGFsIApkZSBJbmZvcm1hw6fDo28gZSBub3MgQ2F0w6Fsb2dvcyBFbGV0csO0bmljb3MgZG8gU2lzdGVtYSBkZSBCaWJsaW90ZWNhcyBkYSBVVEZQUuKAnSBlIGRhIOKAnERlY2xhcmHDp8OjbyAKZGUgQXV0b3JpYeKAnSBlbmNvbnRyYW0tc2UgYXJxdWl2YWRhcyBuYSBCaWJsaW90ZWNhIGRvIEPDom1wdXMgbm8gcXVhbCBvIHRyYWJhbGhvIGZvaSBkZWZlbmRpZG8uIApObyBjYXNvIGRlIHB1YmxpY2HDp8O1ZXMgZGUgYXV0b3JpYSBjb2xldGl2YSBlIG11bHRpY8OibXB1cywgb3MgZG9jdW1lbnRvcyBmaWNhcsOjbyBzb2IgZ3VhcmRhIGRhIApCaWJsaW90ZWNhIGNvbSBhIHF1YWwgbyDigJxwcmltZWlybyBhdXRvcuKAnSBwb3NzdWEgdsOtbmN1bG8uCg==Repositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:32Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
title Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
spellingShingle Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
Souza, Marcos Roberto e
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Escrita - Identificação
Sistemas de reconhecimento de padrões
Aprendizado do computador
Inteligência artificial
Writing - Identification
Pattern recognition systems
Machine learning
Artificial intelligence
title_short Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
title_full Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
title_fullStr Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
title_full_unstemmed Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
title_sort Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos
author Souza, Marcos Roberto e
author_facet Souza, Marcos Roberto e
author_role author
dc.contributor.advisor1.fl_str_mv Gonçalves, Diego Bertolini
dc.contributor.referee1.fl_str_mv Gonçalves, Diego Bertolini
dc.contributor.referee2.fl_str_mv Borsato, Frank Helbert
dc.contributor.referee3.fl_str_mv Valentin, Lucio Geronimo
dc.contributor.referee4.fl_str_mv Alencar, Aretha Barbosa
dc.contributor.author.fl_str_mv Souza, Marcos Roberto e
contributor_str_mv Gonçalves, Diego Bertolini
Gonçalves, Diego Bertolini
Borsato, Frank Helbert
Valentin, Lucio Geronimo
Alencar, Aretha Barbosa
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Escrita - Identificação
Sistemas de reconhecimento de padrões
Aprendizado do computador
Inteligência artificial
Writing - Identification
Pattern recognition systems
Machine learning
Artificial intelligence
dc.subject.por.fl_str_mv Escrita - Identificação
Sistemas de reconhecimento de padrões
Aprendizado do computador
Inteligência artificial
Writing - Identification
Pattern recognition systems
Machine learning
Artificial intelligence
description O reconhecimento de estilos de escrita é uma etapa necessária para automatizar o reconhecimento fim de um sistema multi-estilos. A tarefa de reconhecimento de estilos de escrita é desafiadora devido a similaridade entre alguns estilos. Desta forma, o principal objetivo deste trabalho é realizar uma análise do reconhecimento de estilos de escrita em documentos manuscritos considerando técnicas robustas indiferente do estilo de escrita considerado. Comparamos duas abordagens para o reconhecimento de estilos de escrita, sendo que a primeira consiste na utilização dos descritores de textura GLCM, LBP, LPQ e SURF em conjunto com o classificador SVM, enquanto na segunda abordagem utilizaremos uma técnica de aprendizagem profunda descrita como Rede Neural Convolucional (CNN). Além da comparação, analisamos o impacto da quantidade de informação presente nos documentos manuscritos, a relação existente entre o número de classes (estilos de escrita) e a taxa de reconhecimento e o desempenho dos descritores de textura para esta abordagem. Avaliaremos ainda a importância do processo de compactação de escrita para esta aplicação. Experimentos foram realizados em uma base de dados com cinco classes, nos quais conseguimos taxas de acerto similares as apresentadas na literatura em ambas abordagens, a melhor taxa média de acerto foi de 98,48% utilizando o descritor de textura SURF a partir do documento original. Por meio dos experimentos realizados na primeira abordagem, concluímos que o ganho da compactação de escrita e divisão em blocos está estritamente relacionado ao descritor utilizado. Enquanto que para a segunda, na qual obtemos a melhor taxa média de 91,43%, chegamos a conclusão de que a utilização da compactação de escrita não possui grande impacto, desde que uma quantidade de informação suficiente seja fornecida. Mesmo que a segunda abordagem atingido taxas inferiores, ambas abordagens conseguem taxas de acerto relevantes para o problema.
publishDate 2015
dc.date.issued.fl_str_mv 2015-12-02
dc.date.accessioned.fl_str_mv 2020-11-09T19:10:32Z
dc.date.available.fl_str_mv 2020-11-09T19:10:32Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUZA, Marcos Roberto e. Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos. 2015. 37 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2015.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/6026
identifier_str_mv SOUZA, Marcos Roberto e. Uma análise de diferentes abordagens para o reconhecimento off-line de estilos de escrita em documentos manuscritos. 2015. 37 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2015.
url http://repositorio.utfpr.edu.br/jspui/handle/1/6026
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Computação
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/1/CM_COCIC_2015_2_01.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/2/CM_COCIC_2015_2_01.pdf.jpg
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/3/CM_COCIC_2015_2_01.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6026/4/license.txt
bitstream.checksum.fl_str_mv dabb52a50b56fe4fae9b82d806bcaa8d
9aa18b39915aa1d73b1b80ac013d2ed5
baa819e7588989de628e729de7f16219
dfb14e53a8c6b76b85e77d7a5a3b3809
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923230070865920