Transcrição automática de textos em português escritos à mão usando Deep Learning

Detalhes bibliográficos
Autor(a) principal: Silva, Gabriel Henrique Coelho da
Data de Publicação: 2021
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
Texto Completo: http://app.uff.br/riuff/handle/1/25743
Resumo: A escrita manual é uma parte importante no processo de formação do ser humano. Seja para realizar pequenas anotações ou redigir documentos formais, tem-se a escrita manual como uma ferramenta facilitadora para efetuar registros, especialmente em momentos que recursos tecnológicos podem não estar disponíveis. Diversos setores ainda empregam a escrita manual para a realização de tarefas, principalmente na área da educação, mas também em setores como saúde e segurança. Entretanto, o conteúdo pode ter que ser usado em processos automatizados, requerendo que ele esteja em formato processável por máquina. Nesse sentido, todo conteúdo necessário de interpretação da escrita manual para a conclusão das tarefas, se torna inviável de ser processado em grande quantidade e em tempo hábil utilizando-se apenas da capacidade humana. Diversas técnicas computacionais tem sido empregadas como forma de automatizar o processo de conversão da escrita manual para um formato processável por máquina. Entretanto, os avanços no âmbito da língua portuguesa seguem comedidos em comparação ao que se é registrado em outras línguas, como inglês e chinês. Como contribuição a esse processo, objetiva-se a criação de um protótipo para transcrição automática de textos em português escritos à mão, através de uma vertente do Aprendizado de Máquina conhecida como Deep Learning, onde são explorados métodos e ferramentas consolidadas para extração e reconhecimento de informação textual em imagens. Resultados preliminares demonstram que mesmo sem o treinamento dos modelos embutidos nessas ferramentas para a língua portuguesa, parte do vocabulário foi reconhecido corretamente. A análise também apontou incongruências, se concentrando em aspectos principalmente relacionados ao estilo de escrita empregado e às particularidades da língua portuguesa, como o uso de símbolos, para acentuação e combinação de palavras. Por fim, é proposta uma nova versão do protótipo, tratando alguns casos observados acerca desses problemas e propiciando que mais respostas corretas fossem geradas. Portanto, concluiu-se que a estrutura proposta funciona bem para casos gerais da língua, servindo como base para criação de outras ferramentas que contemplem as especificidades inerentes à língua portuguesa não tratadas nesse trabalho.
id UFF-2_0d1383915b38a156945dd8d7050f8fb8
oai_identifier_str oai:app.uff.br:1/25743
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Transcrição automática de textos em português escritos à mão usando Deep LearningInteligência artificialAprendizado de MáquinaRedes NeuraisReconhecimento de textoEscrita em portuguêsInteligência artificialProcessamento de imagemAprendizado de máquinaArtificial intelligenceMachine LearningNeural NetworksDeep LearningHandwrittenPortuguese text recognitionA escrita manual é uma parte importante no processo de formação do ser humano. Seja para realizar pequenas anotações ou redigir documentos formais, tem-se a escrita manual como uma ferramenta facilitadora para efetuar registros, especialmente em momentos que recursos tecnológicos podem não estar disponíveis. Diversos setores ainda empregam a escrita manual para a realização de tarefas, principalmente na área da educação, mas também em setores como saúde e segurança. Entretanto, o conteúdo pode ter que ser usado em processos automatizados, requerendo que ele esteja em formato processável por máquina. Nesse sentido, todo conteúdo necessário de interpretação da escrita manual para a conclusão das tarefas, se torna inviável de ser processado em grande quantidade e em tempo hábil utilizando-se apenas da capacidade humana. Diversas técnicas computacionais tem sido empregadas como forma de automatizar o processo de conversão da escrita manual para um formato processável por máquina. Entretanto, os avanços no âmbito da língua portuguesa seguem comedidos em comparação ao que se é registrado em outras línguas, como inglês e chinês. Como contribuição a esse processo, objetiva-se a criação de um protótipo para transcrição automática de textos em português escritos à mão, através de uma vertente do Aprendizado de Máquina conhecida como Deep Learning, onde são explorados métodos e ferramentas consolidadas para extração e reconhecimento de informação textual em imagens. Resultados preliminares demonstram que mesmo sem o treinamento dos modelos embutidos nessas ferramentas para a língua portuguesa, parte do vocabulário foi reconhecido corretamente. A análise também apontou incongruências, se concentrando em aspectos principalmente relacionados ao estilo de escrita empregado e às particularidades da língua portuguesa, como o uso de símbolos, para acentuação e combinação de palavras. Por fim, é proposta uma nova versão do protótipo, tratando alguns casos observados acerca desses problemas e propiciando que mais respostas corretas fossem geradas. Portanto, concluiu-se que a estrutura proposta funciona bem para casos gerais da língua, servindo como base para criação de outras ferramentas que contemplem as especificidades inerentes à língua portuguesa não tratadas nesse trabalho.Handwriting is an integral part of the human formation process. Handwriting is a facilitating tool to make records, especially when technological resources may not be available, whether to make small notes or write formal documents. Several sectors still employ handwriting to carry out tasks, mainly in education, and in sectors such as healthcare and safety. However, content may have to be used in automated processes, requiring it to be in a machine-processable format. In this sense, all the necessary content for handwriting interpretation becomes unfeasible to be processed in large quantities and on time, using only human capacity. Several computing techniques are applied as a way to automate the process of converting handwriting to a machine-processable format. Nevertheless, advances in the scope of Portuguese language remain moderate compared to what is done in other languages, such as English and Chinese. This work contributes to this scenario by proposing and analysing a prototype for automatic transcription of handwritten texts in Portuguese, through a Machine Learning strand known as Deep Learning. It includes consolidate methods and tools for extracting and recognition of textual information contained in images. Preliminary results point out that even without training the models embedded in these tools for the Portuguese language, part of the vocabulary was correctly recognized. The analysis also pointed out some failures, concerning mainly the writing style and particularities of Portuguese language, such as the use of symbols for accentuation and combination of words. Finally, a new version of the prototype is proposed to deal with some cases based on the problems reported, generating more correct answers. Therefore, we can conclude that the tool work well for part of Portuguese vocabulary and it can serve as a basis for the development of other tools to address the particularities of the Portuguese languages that this work does not tackle.69 p.Carvalho, Aline Marins PaesMontenegro, Anselmo AntunesAraújo, Leandro Santiago deSilva, Gabriel Henrique Coelho da2022-07-19T16:09:15Z2022-07-19T16:09:15Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSILVA, Gabriel Henrique Coelho da. Transcrição automática de textos em português escritos à mão usando Deep Learning. 2021. 69 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal Fluminense, Instituto de Computação, Niterói, 2021.http://app.uff.br/riuff/handle/1/25743CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-19T16:09:19Zoai:app.uff.br:1/25743Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:11:07.196701Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Transcrição automática de textos em português escritos à mão usando Deep Learning
title Transcrição automática de textos em português escritos à mão usando Deep Learning
spellingShingle Transcrição automática de textos em português escritos à mão usando Deep Learning
Silva, Gabriel Henrique Coelho da
Inteligência artificial
Aprendizado de Máquina
Redes Neurais
Reconhecimento de texto
Escrita em português
Inteligência artificial
Processamento de imagem
Aprendizado de máquina
Artificial intelligence
Machine Learning
Neural Networks
Deep Learning
Handwritten
Portuguese text recognition
title_short Transcrição automática de textos em português escritos à mão usando Deep Learning
title_full Transcrição automática de textos em português escritos à mão usando Deep Learning
title_fullStr Transcrição automática de textos em português escritos à mão usando Deep Learning
title_full_unstemmed Transcrição automática de textos em português escritos à mão usando Deep Learning
title_sort Transcrição automática de textos em português escritos à mão usando Deep Learning
author Silva, Gabriel Henrique Coelho da
author_facet Silva, Gabriel Henrique Coelho da
author_role author
dc.contributor.none.fl_str_mv Carvalho, Aline Marins Paes
Montenegro, Anselmo Antunes
Araújo, Leandro Santiago de
dc.contributor.author.fl_str_mv Silva, Gabriel Henrique Coelho da
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado de Máquina
Redes Neurais
Reconhecimento de texto
Escrita em português
Inteligência artificial
Processamento de imagem
Aprendizado de máquina
Artificial intelligence
Machine Learning
Neural Networks
Deep Learning
Handwritten
Portuguese text recognition
topic Inteligência artificial
Aprendizado de Máquina
Redes Neurais
Reconhecimento de texto
Escrita em português
Inteligência artificial
Processamento de imagem
Aprendizado de máquina
Artificial intelligence
Machine Learning
Neural Networks
Deep Learning
Handwritten
Portuguese text recognition
description A escrita manual é uma parte importante no processo de formação do ser humano. Seja para realizar pequenas anotações ou redigir documentos formais, tem-se a escrita manual como uma ferramenta facilitadora para efetuar registros, especialmente em momentos que recursos tecnológicos podem não estar disponíveis. Diversos setores ainda empregam a escrita manual para a realização de tarefas, principalmente na área da educação, mas também em setores como saúde e segurança. Entretanto, o conteúdo pode ter que ser usado em processos automatizados, requerendo que ele esteja em formato processável por máquina. Nesse sentido, todo conteúdo necessário de interpretação da escrita manual para a conclusão das tarefas, se torna inviável de ser processado em grande quantidade e em tempo hábil utilizando-se apenas da capacidade humana. Diversas técnicas computacionais tem sido empregadas como forma de automatizar o processo de conversão da escrita manual para um formato processável por máquina. Entretanto, os avanços no âmbito da língua portuguesa seguem comedidos em comparação ao que se é registrado em outras línguas, como inglês e chinês. Como contribuição a esse processo, objetiva-se a criação de um protótipo para transcrição automática de textos em português escritos à mão, através de uma vertente do Aprendizado de Máquina conhecida como Deep Learning, onde são explorados métodos e ferramentas consolidadas para extração e reconhecimento de informação textual em imagens. Resultados preliminares demonstram que mesmo sem o treinamento dos modelos embutidos nessas ferramentas para a língua portuguesa, parte do vocabulário foi reconhecido corretamente. A análise também apontou incongruências, se concentrando em aspectos principalmente relacionados ao estilo de escrita empregado e às particularidades da língua portuguesa, como o uso de símbolos, para acentuação e combinação de palavras. Por fim, é proposta uma nova versão do protótipo, tratando alguns casos observados acerca desses problemas e propiciando que mais respostas corretas fossem geradas. Portanto, concluiu-se que a estrutura proposta funciona bem para casos gerais da língua, servindo como base para criação de outras ferramentas que contemplem as especificidades inerentes à língua portuguesa não tratadas nesse trabalho.
publishDate 2021
dc.date.none.fl_str_mv 2021
2022-07-19T16:09:15Z
2022-07-19T16:09:15Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Gabriel Henrique Coelho da. Transcrição automática de textos em português escritos à mão usando Deep Learning. 2021. 69 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal Fluminense, Instituto de Computação, Niterói, 2021.
http://app.uff.br/riuff/handle/1/25743
identifier_str_mv SILVA, Gabriel Henrique Coelho da. Transcrição automática de textos em português escritos à mão usando Deep Learning. 2021. 69 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal Fluminense, Instituto de Computação, Niterói, 2021.
url http://app.uff.br/riuff/handle/1/25743
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1811823684304764928