Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL)
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | http://www.teses.usp.br/teses/disponiveis/45/45134/tde-07112019-221533/ |
Resumo: | Avanços significativos no reconhecimento de manuscritos rasurados e na recuperação de textos degradados tem sido obtidos através do uso de técnicas de aprendizado de máquina. No entanto, o grande número de exemplos necessários na etapa de treinamento pode comprometer o uso prático de tais métodos. Este trabalho descreve um modelo de aprendizado para a classificação de dígitos rasurados denominado de \"aprendizado por um tiro\'\', pois que permite uma caracterização mais próximo ao de um ser humano. O termo \"aprendizado por um-tiro\'\' especifica que o aprendizado de um novo conceito é obtido pelo reconhecimento dos principais traços característicos de um objeto, palavra ou símbolo dado um conhecimento a priori relativamente pequeno sobre um novo objeto ainda não identificado. Deste modo, este pré conceito sobre sua caracterização admite a construção de classificadores que realizem a predição a partir de uma imagem de teste como entrada com um conjunto reduzido de imagens de treinamento. Este projeto cria um método que busca classificar imagens rasuradas de manuscritos a partir de um conjunto reduzido de imagens de treinamento sem rasura. Todo o pré-ajuste calculado através dessas imagens são separados por amostras chamadas de \"programas\'\', ou seja, uma composição do conhecimento a priori de todos os traços e sub-traços existentes na imagem, componentes estas que atribuem variabilidades locais e globais que poderão ser reconhecidas estatisticamente por Inferência Bayesiana. Destacamos aqui que o modelo consegue predizer dígitos e símbolos independentemente das rasuras pré-dispostas no conjunto de imagens de testes, onde este conhecimento a priori é inexistente dentro do conjunto de imagens de treinamento. Apresentamos em nossos resultados uma análise que, dado o ajuste inicial aplicado pelo aprendizado Bayesiano de Programas (BPL), nos permitiu utilizar características locais (traços) retiradas de cada símbolo para mensurar o custo referente entre todos os traços de uma imagem de teste e os traços em cada classe representado como imagem de treinamento. Para a obtenção do custo, utilizamos da métrica de deformação dinâmica aplicado em séries temporais (DTW). Finalmente, realizamos a predição para cada grupo de execuções considerando três conjuntos de dados: no primeiro com o grupo de imagens de teste rasuradas, no qual se obteve uma média global de acertos de 76%; no segundo conjunto com imagens de testes sem rasura (com diferença nos traços entre teste e treinamento), obtivemos uma média de 90% para com os acertos; e o terceiro conjunto usando o Omniglot. Tais reajustes adquiridos com poucos exemplos vislumbram futuras aplicações mais complexas em manuscritos degenerados ainda não digitalizados. |
id |
USP_c87f2928a6e1379db85cf2ee4c729948 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-07112019-221533 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL)Detection of erasures in symbols with Bayesian program learningAprendizado de máquinaBPLBPLCiência cognitivaCognitive scienceDTWDTWErasureHandwrittenMachine learningManuscritosRasurasAvanços significativos no reconhecimento de manuscritos rasurados e na recuperação de textos degradados tem sido obtidos através do uso de técnicas de aprendizado de máquina. No entanto, o grande número de exemplos necessários na etapa de treinamento pode comprometer o uso prático de tais métodos. Este trabalho descreve um modelo de aprendizado para a classificação de dígitos rasurados denominado de \"aprendizado por um tiro\'\', pois que permite uma caracterização mais próximo ao de um ser humano. O termo \"aprendizado por um-tiro\'\' especifica que o aprendizado de um novo conceito é obtido pelo reconhecimento dos principais traços característicos de um objeto, palavra ou símbolo dado um conhecimento a priori relativamente pequeno sobre um novo objeto ainda não identificado. Deste modo, este pré conceito sobre sua caracterização admite a construção de classificadores que realizem a predição a partir de uma imagem de teste como entrada com um conjunto reduzido de imagens de treinamento. Este projeto cria um método que busca classificar imagens rasuradas de manuscritos a partir de um conjunto reduzido de imagens de treinamento sem rasura. Todo o pré-ajuste calculado através dessas imagens são separados por amostras chamadas de \"programas\'\', ou seja, uma composição do conhecimento a priori de todos os traços e sub-traços existentes na imagem, componentes estas que atribuem variabilidades locais e globais que poderão ser reconhecidas estatisticamente por Inferência Bayesiana. Destacamos aqui que o modelo consegue predizer dígitos e símbolos independentemente das rasuras pré-dispostas no conjunto de imagens de testes, onde este conhecimento a priori é inexistente dentro do conjunto de imagens de treinamento. Apresentamos em nossos resultados uma análise que, dado o ajuste inicial aplicado pelo aprendizado Bayesiano de Programas (BPL), nos permitiu utilizar características locais (traços) retiradas de cada símbolo para mensurar o custo referente entre todos os traços de uma imagem de teste e os traços em cada classe representado como imagem de treinamento. Para a obtenção do custo, utilizamos da métrica de deformação dinâmica aplicado em séries temporais (DTW). Finalmente, realizamos a predição para cada grupo de execuções considerando três conjuntos de dados: no primeiro com o grupo de imagens de teste rasuradas, no qual se obteve uma média global de acertos de 76%; no segundo conjunto com imagens de testes sem rasura (com diferença nos traços entre teste e treinamento), obtivemos uma média de 90% para com os acertos; e o terceiro conjunto usando o Omniglot. Tais reajustes adquiridos com poucos exemplos vislumbram futuras aplicações mais complexas em manuscritos degenerados ainda não digitalizados.Significant advances in the recognition of erasured handwritten texts and in the recovery of degraded texts have been obtained through the use of machine learning techniques. However, the large number of examples required in the training stage can compromise the practical use of such methods. This paper describes a learning model for the classification of erased digits known as \"one-shot learning\'\', which employs a characterization closest to that of a human being. The term \"one-shot learning\'\' specifies that the learning of a new concept is obtained by the perception of main characteristic traits of an object, word, or symbol given a prior relatively small knowledge about a new object not yet identified. Thus, its allows for the construction of classifiers that performs the prediction using a reduced set of training images. This work describes a method that seeks to classify images containing handwritten digits with erasures given a set of training images without any erasures. Every calculated fitting using these images are called \"programs\'\', i.e., a composition of prior features of all strokes and sub-strokes in the image that can be statistically recognized by Bayesian Inference. This model, known as Bayesian Program Learning (BPL), is then able to predict digits and symbols regardless of the erasures present in the set of test images, where this prior knowledge is non-existent within the set of training images. Given an applied fitting, the local features of strokes taken from each symbol were used to measure the relative cost between all strokes between a test image and the class represented by a training image. To obtain this cost, a Dynamic Time Warping (DTW) algorithm applied to 2D time series was employed. This method achieved an average accuracy of 76% for recognizing erased digits, and 90% for recognizing digits with no erasures (in which the tests present a deformed shape compared to trained image). While the overall accuracy is still low compared to traditional deep learning techniques, this method requires fewer training datasets, and with proper characterization of stroke features it may aid in the recovery on degenerated handwritten text.Biblioteca Digitais de Teses e Dissertações da USPJackowski, Marcel ParolinCosta, Raphael Davis de Oliveira2019-05-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/45/45134/tde-07112019-221533/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-11-08T23:43:02Zoai:teses.usp.br:tde-07112019-221533Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-11-08T23:43:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) Detection of erasures in symbols with Bayesian program learning |
title |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) |
spellingShingle |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) Costa, Raphael Davis de Oliveira Aprendizado de máquina BPL BPL Ciência cognitiva Cognitive science DTW DTW Erasure Handwritten Machine learning Manuscritos Rasuras |
title_short |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) |
title_full |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) |
title_fullStr |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) |
title_full_unstemmed |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) |
title_sort |
Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL) |
author |
Costa, Raphael Davis de Oliveira |
author_facet |
Costa, Raphael Davis de Oliveira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Jackowski, Marcel Parolin |
dc.contributor.author.fl_str_mv |
Costa, Raphael Davis de Oliveira |
dc.subject.por.fl_str_mv |
Aprendizado de máquina BPL BPL Ciência cognitiva Cognitive science DTW DTW Erasure Handwritten Machine learning Manuscritos Rasuras |
topic |
Aprendizado de máquina BPL BPL Ciência cognitiva Cognitive science DTW DTW Erasure Handwritten Machine learning Manuscritos Rasuras |
description |
Avanços significativos no reconhecimento de manuscritos rasurados e na recuperação de textos degradados tem sido obtidos através do uso de técnicas de aprendizado de máquina. No entanto, o grande número de exemplos necessários na etapa de treinamento pode comprometer o uso prático de tais métodos. Este trabalho descreve um modelo de aprendizado para a classificação de dígitos rasurados denominado de \"aprendizado por um tiro\'\', pois que permite uma caracterização mais próximo ao de um ser humano. O termo \"aprendizado por um-tiro\'\' especifica que o aprendizado de um novo conceito é obtido pelo reconhecimento dos principais traços característicos de um objeto, palavra ou símbolo dado um conhecimento a priori relativamente pequeno sobre um novo objeto ainda não identificado. Deste modo, este pré conceito sobre sua caracterização admite a construção de classificadores que realizem a predição a partir de uma imagem de teste como entrada com um conjunto reduzido de imagens de treinamento. Este projeto cria um método que busca classificar imagens rasuradas de manuscritos a partir de um conjunto reduzido de imagens de treinamento sem rasura. Todo o pré-ajuste calculado através dessas imagens são separados por amostras chamadas de \"programas\'\', ou seja, uma composição do conhecimento a priori de todos os traços e sub-traços existentes na imagem, componentes estas que atribuem variabilidades locais e globais que poderão ser reconhecidas estatisticamente por Inferência Bayesiana. Destacamos aqui que o modelo consegue predizer dígitos e símbolos independentemente das rasuras pré-dispostas no conjunto de imagens de testes, onde este conhecimento a priori é inexistente dentro do conjunto de imagens de treinamento. Apresentamos em nossos resultados uma análise que, dado o ajuste inicial aplicado pelo aprendizado Bayesiano de Programas (BPL), nos permitiu utilizar características locais (traços) retiradas de cada símbolo para mensurar o custo referente entre todos os traços de uma imagem de teste e os traços em cada classe representado como imagem de treinamento. Para a obtenção do custo, utilizamos da métrica de deformação dinâmica aplicado em séries temporais (DTW). Finalmente, realizamos a predição para cada grupo de execuções considerando três conjuntos de dados: no primeiro com o grupo de imagens de teste rasuradas, no qual se obteve uma média global de acertos de 76%; no segundo conjunto com imagens de testes sem rasura (com diferença nos traços entre teste e treinamento), obtivemos uma média de 90% para com os acertos; e o terceiro conjunto usando o Omniglot. Tais reajustes adquiridos com poucos exemplos vislumbram futuras aplicações mais complexas em manuscritos degenerados ainda não digitalizados. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-05-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/45/45134/tde-07112019-221533/ |
url |
http://www.teses.usp.br/teses/disponiveis/45/45134/tde-07112019-221533/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1815256771453779968 |