Transcrição automática de textos em português escritos à mão usando Deep Learning
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
Texto Completo: | http://app.uff.br/riuff/handle/1/25743 |
Resumo: | A escrita manual é uma parte importante no processo de formação do ser humano. Seja para realizar pequenas anotações ou redigir documentos formais, tem-se a escrita manual como uma ferramenta facilitadora para efetuar registros, especialmente em momentos que recursos tecnológicos podem não estar disponíveis. Diversos setores ainda empregam a escrita manual para a realização de tarefas, principalmente na área da educação, mas também em setores como saúde e segurança. Entretanto, o conteúdo pode ter que ser usado em processos automatizados, requerendo que ele esteja em formato processável por máquina. Nesse sentido, todo conteúdo necessário de interpretação da escrita manual para a conclusão das tarefas, se torna inviável de ser processado em grande quantidade e em tempo hábil utilizando-se apenas da capacidade humana. Diversas técnicas computacionais tem sido empregadas como forma de automatizar o processo de conversão da escrita manual para um formato processável por máquina. Entretanto, os avanços no âmbito da língua portuguesa seguem comedidos em comparação ao que se é registrado em outras línguas, como inglês e chinês. Como contribuição a esse processo, objetiva-se a criação de um protótipo para transcrição automática de textos em português escritos à mão, através de uma vertente do Aprendizado de Máquina conhecida como Deep Learning, onde são explorados métodos e ferramentas consolidadas para extração e reconhecimento de informação textual em imagens. Resultados preliminares demonstram que mesmo sem o treinamento dos modelos embutidos nessas ferramentas para a língua portuguesa, parte do vocabulário foi reconhecido corretamente. A análise também apontou incongruências, se concentrando em aspectos principalmente relacionados ao estilo de escrita empregado e às particularidades da língua portuguesa, como o uso de símbolos, para acentuação e combinação de palavras. Por fim, é proposta uma nova versão do protótipo, tratando alguns casos observados acerca desses problemas e propiciando que mais respostas corretas fossem geradas. Portanto, concluiu-se que a estrutura proposta funciona bem para casos gerais da língua, servindo como base para criação de outras ferramentas que contemplem as especificidades inerentes à língua portuguesa não tratadas nesse trabalho. |
id |
UFF-2_0d1383915b38a156945dd8d7050f8fb8 |
---|---|
oai_identifier_str |
oai:app.uff.br:1/25743 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Transcrição automática de textos em português escritos à mão usando Deep LearningInteligência artificialAprendizado de MáquinaRedes NeuraisReconhecimento de textoEscrita em portuguêsInteligência artificialProcessamento de imagemAprendizado de máquinaArtificial intelligenceMachine LearningNeural NetworksDeep LearningHandwrittenPortuguese text recognitionA escrita manual é uma parte importante no processo de formação do ser humano. Seja para realizar pequenas anotações ou redigir documentos formais, tem-se a escrita manual como uma ferramenta facilitadora para efetuar registros, especialmente em momentos que recursos tecnológicos podem não estar disponíveis. Diversos setores ainda empregam a escrita manual para a realização de tarefas, principalmente na área da educação, mas também em setores como saúde e segurança. Entretanto, o conteúdo pode ter que ser usado em processos automatizados, requerendo que ele esteja em formato processável por máquina. Nesse sentido, todo conteúdo necessário de interpretação da escrita manual para a conclusão das tarefas, se torna inviável de ser processado em grande quantidade e em tempo hábil utilizando-se apenas da capacidade humana. Diversas técnicas computacionais tem sido empregadas como forma de automatizar o processo de conversão da escrita manual para um formato processável por máquina. Entretanto, os avanços no âmbito da língua portuguesa seguem comedidos em comparação ao que se é registrado em outras línguas, como inglês e chinês. Como contribuição a esse processo, objetiva-se a criação de um protótipo para transcrição automática de textos em português escritos à mão, através de uma vertente do Aprendizado de Máquina conhecida como Deep Learning, onde são explorados métodos e ferramentas consolidadas para extração e reconhecimento de informação textual em imagens. Resultados preliminares demonstram que mesmo sem o treinamento dos modelos embutidos nessas ferramentas para a língua portuguesa, parte do vocabulário foi reconhecido corretamente. A análise também apontou incongruências, se concentrando em aspectos principalmente relacionados ao estilo de escrita empregado e às particularidades da língua portuguesa, como o uso de símbolos, para acentuação e combinação de palavras. Por fim, é proposta uma nova versão do protótipo, tratando alguns casos observados acerca desses problemas e propiciando que mais respostas corretas fossem geradas. Portanto, concluiu-se que a estrutura proposta funciona bem para casos gerais da língua, servindo como base para criação de outras ferramentas que contemplem as especificidades inerentes à língua portuguesa não tratadas nesse trabalho.Handwriting is an integral part of the human formation process. Handwriting is a facilitating tool to make records, especially when technological resources may not be available, whether to make small notes or write formal documents. Several sectors still employ handwriting to carry out tasks, mainly in education, and in sectors such as healthcare and safety. However, content may have to be used in automated processes, requiring it to be in a machine-processable format. In this sense, all the necessary content for handwriting interpretation becomes unfeasible to be processed in large quantities and on time, using only human capacity. Several computing techniques are applied as a way to automate the process of converting handwriting to a machine-processable format. Nevertheless, advances in the scope of Portuguese language remain moderate compared to what is done in other languages, such as English and Chinese. This work contributes to this scenario by proposing and analysing a prototype for automatic transcription of handwritten texts in Portuguese, through a Machine Learning strand known as Deep Learning. It includes consolidate methods and tools for extracting and recognition of textual information contained in images. Preliminary results point out that even without training the models embedded in these tools for the Portuguese language, part of the vocabulary was correctly recognized. The analysis also pointed out some failures, concerning mainly the writing style and particularities of Portuguese language, such as the use of symbols for accentuation and combination of words. Finally, a new version of the prototype is proposed to deal with some cases based on the problems reported, generating more correct answers. Therefore, we can conclude that the tool work well for part of Portuguese vocabulary and it can serve as a basis for the development of other tools to address the particularities of the Portuguese languages that this work does not tackle.69 p.Carvalho, Aline Marins PaesMontenegro, Anselmo AntunesAraújo, Leandro Santiago deSilva, Gabriel Henrique Coelho da2022-07-19T16:09:15Z2022-07-19T16:09:15Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSILVA, Gabriel Henrique Coelho da. Transcrição automática de textos em português escritos à mão usando Deep Learning. 2021. 69 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal Fluminense, Instituto de Computação, Niterói, 2021.http://app.uff.br/riuff/handle/1/25743CC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2022-07-19T16:09:19Zoai:app.uff.br:1/25743Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-08-19T11:11:07.196701Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Transcrição automática de textos em português escritos à mão usando Deep Learning |
title |
Transcrição automática de textos em português escritos à mão usando Deep Learning |
spellingShingle |
Transcrição automática de textos em português escritos à mão usando Deep Learning Silva, Gabriel Henrique Coelho da Inteligência artificial Aprendizado de Máquina Redes Neurais Reconhecimento de texto Escrita em português Inteligência artificial Processamento de imagem Aprendizado de máquina Artificial intelligence Machine Learning Neural Networks Deep Learning Handwritten Portuguese text recognition |
title_short |
Transcrição automática de textos em português escritos à mão usando Deep Learning |
title_full |
Transcrição automática de textos em português escritos à mão usando Deep Learning |
title_fullStr |
Transcrição automática de textos em português escritos à mão usando Deep Learning |
title_full_unstemmed |
Transcrição automática de textos em português escritos à mão usando Deep Learning |
title_sort |
Transcrição automática de textos em português escritos à mão usando Deep Learning |
author |
Silva, Gabriel Henrique Coelho da |
author_facet |
Silva, Gabriel Henrique Coelho da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Carvalho, Aline Marins Paes Montenegro, Anselmo Antunes Araújo, Leandro Santiago de |
dc.contributor.author.fl_str_mv |
Silva, Gabriel Henrique Coelho da |
dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado de Máquina Redes Neurais Reconhecimento de texto Escrita em português Inteligência artificial Processamento de imagem Aprendizado de máquina Artificial intelligence Machine Learning Neural Networks Deep Learning Handwritten Portuguese text recognition |
topic |
Inteligência artificial Aprendizado de Máquina Redes Neurais Reconhecimento de texto Escrita em português Inteligência artificial Processamento de imagem Aprendizado de máquina Artificial intelligence Machine Learning Neural Networks Deep Learning Handwritten Portuguese text recognition |
description |
A escrita manual é uma parte importante no processo de formação do ser humano. Seja para realizar pequenas anotações ou redigir documentos formais, tem-se a escrita manual como uma ferramenta facilitadora para efetuar registros, especialmente em momentos que recursos tecnológicos podem não estar disponíveis. Diversos setores ainda empregam a escrita manual para a realização de tarefas, principalmente na área da educação, mas também em setores como saúde e segurança. Entretanto, o conteúdo pode ter que ser usado em processos automatizados, requerendo que ele esteja em formato processável por máquina. Nesse sentido, todo conteúdo necessário de interpretação da escrita manual para a conclusão das tarefas, se torna inviável de ser processado em grande quantidade e em tempo hábil utilizando-se apenas da capacidade humana. Diversas técnicas computacionais tem sido empregadas como forma de automatizar o processo de conversão da escrita manual para um formato processável por máquina. Entretanto, os avanços no âmbito da língua portuguesa seguem comedidos em comparação ao que se é registrado em outras línguas, como inglês e chinês. Como contribuição a esse processo, objetiva-se a criação de um protótipo para transcrição automática de textos em português escritos à mão, através de uma vertente do Aprendizado de Máquina conhecida como Deep Learning, onde são explorados métodos e ferramentas consolidadas para extração e reconhecimento de informação textual em imagens. Resultados preliminares demonstram que mesmo sem o treinamento dos modelos embutidos nessas ferramentas para a língua portuguesa, parte do vocabulário foi reconhecido corretamente. A análise também apontou incongruências, se concentrando em aspectos principalmente relacionados ao estilo de escrita empregado e às particularidades da língua portuguesa, como o uso de símbolos, para acentuação e combinação de palavras. Por fim, é proposta uma nova versão do protótipo, tratando alguns casos observados acerca desses problemas e propiciando que mais respostas corretas fossem geradas. Portanto, concluiu-se que a estrutura proposta funciona bem para casos gerais da língua, servindo como base para criação de outras ferramentas que contemplem as especificidades inerentes à língua portuguesa não tratadas nesse trabalho. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2022-07-19T16:09:15Z 2022-07-19T16:09:15Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
SILVA, Gabriel Henrique Coelho da. Transcrição automática de textos em português escritos à mão usando Deep Learning. 2021. 69 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal Fluminense, Instituto de Computação, Niterói, 2021. http://app.uff.br/riuff/handle/1/25743 |
identifier_str_mv |
SILVA, Gabriel Henrique Coelho da. Transcrição automática de textos em português escritos à mão usando Deep Learning. 2021. 69 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal Fluminense, Instituto de Computação, Niterói, 2021. |
url |
http://app.uff.br/riuff/handle/1/25743 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1811823684304764928 |