Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras

Detalhes bibliográficos
Autor(a) principal: Abreu, Douglas Vinicius de
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/6004
Resumo: O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento.
id UTFPR-12_5ad1d1cbdb85c8e9f699ddde6d2ca0f3
oai_identifier_str oai:repositorio.utfpr.edu.br:1/6004
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2020-11-09T19:10:10Z2020-11-09T19:10:10Z2019-11-28ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/6004O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento.Script recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process.porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSistemas de reconhecimento de padrõesEscrita - IdentificaçãoComputaçãoPattern recognition systemsWriting - IdentificationComputer scienceReconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavrasScript recognition from handwritten documents : document, line and word-level approachinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCampo MourãoGonçalves, Diego BertoliniKawamoto, André Luiz SatoshiAlencar, Aretha BarbosaGonçalves, Diego BertoliniAbreu, Douglas Vinicius deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALreconhecimentoescritadocumentosmanuscritos.pdfapplication/pdf983760http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/1/reconhecimentoescritadocumentosmanuscritos.pdfe3b86d804ecfe0212ea4f1d6c4b61a79MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTreconhecimentoescritadocumentosmanuscritos.pdf.txtExtracted texttext/plain69258http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/3/reconhecimentoescritadocumentosmanuscritos.pdf.txt4016de1c6f54bd498e2ffcd3f528883eMD53THUMBNAILreconhecimentoescritadocumentosmanuscritos.pdf.jpgGenerated Thumbnailimage/jpeg1342http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/4/reconhecimentoescritadocumentosmanuscritos.pdf.jpgcad7013a3a59c4fab0b2212029ec14a5MD541/60042020-11-09 17:10:10.895oai:repositorio.utfpr.edu.br:1/6004TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:10Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
dc.title.alternative.pt_BR.fl_str_mv Script recognition from handwritten documents : document, line and word-level approach
title Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
spellingShingle Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
Abreu, Douglas Vinicius de
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Sistemas de reconhecimento de padrões
Escrita - Identificação
Computação
Pattern recognition systems
Writing - Identification
Computer science
title_short Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_full Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_fullStr Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_full_unstemmed Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_sort Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
author Abreu, Douglas Vinicius de
author_facet Abreu, Douglas Vinicius de
author_role author
dc.contributor.advisor1.fl_str_mv Gonçalves, Diego Bertolini
dc.contributor.referee1.fl_str_mv Kawamoto, André Luiz Satoshi
dc.contributor.referee2.fl_str_mv Alencar, Aretha Barbosa
dc.contributor.referee3.fl_str_mv Gonçalves, Diego Bertolini
dc.contributor.author.fl_str_mv Abreu, Douglas Vinicius de
contributor_str_mv Gonçalves, Diego Bertolini
Kawamoto, André Luiz Satoshi
Alencar, Aretha Barbosa
Gonçalves, Diego Bertolini
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Sistemas de reconhecimento de padrões
Escrita - Identificação
Computação
Pattern recognition systems
Writing - Identification
Computer science
dc.subject.por.fl_str_mv Sistemas de reconhecimento de padrões
Escrita - Identificação
Computação
Pattern recognition systems
Writing - Identification
Computer science
description O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento.
publishDate 2019
dc.date.issued.fl_str_mv 2019-11-28
dc.date.accessioned.fl_str_mv 2020-11-09T19:10:10Z
dc.date.available.fl_str_mv 2020-11-09T19:10:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/6004
identifier_str_mv ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/6004
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.publisher.program.fl_str_mv Ciência da Computação
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Departamento Acadêmico de Computação
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/1/reconhecimentoescritadocumentosmanuscritos.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/2/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/3/reconhecimentoescritadocumentosmanuscritos.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/4/reconhecimentoescritadocumentosmanuscritos.pdf.jpg
bitstream.checksum.fl_str_mv e3b86d804ecfe0212ea4f1d6c4b61a79
b9d82215ab23456fa2d8b49c5df1b95b
4016de1c6f54bd498e2ffcd3f528883e
cad7013a3a59c4fab0b2212029ec14a5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1797043952887529472