Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/6004 |
Resumo: | O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento. |
id |
UTFPR-12_5ad1d1cbdb85c8e9f699ddde6d2ca0f3 |
---|---|
oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/6004 |
network_acronym_str |
UTFPR-12 |
network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
repository_id_str |
|
spelling |
2020-11-09T19:10:10Z2020-11-09T19:10:10Z2019-11-28ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/6004O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento.Script recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process.porUniversidade Tecnológica Federal do ParanáCampo MouraoCiência da ComputaçãoUTFPRBrasilDepartamento Acadêmico de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOSistemas de reconhecimento de padrõesEscrita - IdentificaçãoComputaçãoPattern recognition systemsWriting - IdentificationComputer scienceReconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavrasScript recognition from handwritten documents : document, line and word-level approachinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisCampo MourãoGonçalves, Diego BertoliniKawamoto, André Luiz SatoshiAlencar, Aretha BarbosaGonçalves, Diego BertoliniAbreu, Douglas Vinicius deinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALreconhecimentoescritadocumentosmanuscritos.pdfapplication/pdf983760http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/1/reconhecimentoescritadocumentosmanuscritos.pdfe3b86d804ecfe0212ea4f1d6c4b61a79MD51LICENSElicense.txttext/plain1290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/2/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD52TEXTreconhecimentoescritadocumentosmanuscritos.pdf.txtExtracted texttext/plain69258http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/3/reconhecimentoescritadocumentosmanuscritos.pdf.txt4016de1c6f54bd498e2ffcd3f528883eMD53THUMBNAILreconhecimentoescritadocumentosmanuscritos.pdf.jpgGenerated Thumbnailimage/jpeg1342http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/4/reconhecimentoescritadocumentosmanuscritos.pdf.jpgcad7013a3a59c4fab0b2212029ec14a5MD541/60042020-11-09 17:10:10.895oai:repositorio.utfpr.edu.br:1/6004TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2020-11-09T19:10:10Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
dc.title.pt_BR.fl_str_mv |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
dc.title.alternative.pt_BR.fl_str_mv |
Script recognition from handwritten documents : document, line and word-level approach |
title |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
spellingShingle |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras Abreu, Douglas Vinicius de CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Sistemas de reconhecimento de padrões Escrita - Identificação Computação Pattern recognition systems Writing - Identification Computer science |
title_short |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
title_full |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
title_fullStr |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
title_full_unstemmed |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
title_sort |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
author |
Abreu, Douglas Vinicius de |
author_facet |
Abreu, Douglas Vinicius de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Gonçalves, Diego Bertolini |
dc.contributor.referee1.fl_str_mv |
Kawamoto, André Luiz Satoshi |
dc.contributor.referee2.fl_str_mv |
Alencar, Aretha Barbosa |
dc.contributor.referee3.fl_str_mv |
Gonçalves, Diego Bertolini |
dc.contributor.author.fl_str_mv |
Abreu, Douglas Vinicius de |
contributor_str_mv |
Gonçalves, Diego Bertolini Kawamoto, André Luiz Satoshi Alencar, Aretha Barbosa Gonçalves, Diego Bertolini |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Sistemas de reconhecimento de padrões Escrita - Identificação Computação Pattern recognition systems Writing - Identification Computer science |
dc.subject.por.fl_str_mv |
Sistemas de reconhecimento de padrões Escrita - Identificação Computação Pattern recognition systems Writing - Identification Computer science |
description |
O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-11-28 |
dc.date.accessioned.fl_str_mv |
2020-11-09T19:10:10Z |
dc.date.available.fl_str_mv |
2020-11-09T19:10:10Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019. |
dc.identifier.uri.fl_str_mv |
http://repositorio.utfpr.edu.br/jspui/handle/1/6004 |
identifier_str_mv |
ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019. |
url |
http://repositorio.utfpr.edu.br/jspui/handle/1/6004 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao |
dc.publisher.program.fl_str_mv |
Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UTFPR |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Departamento Acadêmico de Computação |
publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
instacron_str |
UTFPR |
institution |
UTFPR |
reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
bitstream.url.fl_str_mv |
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/1/reconhecimentoescritadocumentosmanuscritos.pdf http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/2/license.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/3/reconhecimentoescritadocumentosmanuscritos.pdf.txt http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/6004/4/reconhecimentoescritadocumentosmanuscritos.pdf.jpg |
bitstream.checksum.fl_str_mv |
e3b86d804ecfe0212ea4f1d6c4b61a79 b9d82215ab23456fa2d8b49c5df1b95b 4016de1c6f54bd498e2ffcd3f528883e cad7013a3a59c4fab0b2212029ec14a5 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
repository.mail.fl_str_mv |
|
_version_ |
1797043952887529472 |