Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFOP |
Texto Completo: | http://www.repositorio.ufop.br/handle/123456789/12579 |
Resumo: | Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
id |
UFOP_740f4c520e598511b79b7d2814294c06 |
---|---|
oai_identifier_str |
oai:localhost:123456789/12579 |
network_acronym_str |
UFOP |
network_name_str |
Repositório Institucional da UFOP |
repository_id_str |
3233 |
spelling |
Peixoto, Sirlene Pio Gomes da SilvaGomes, David MenottiBianchi, Andrea Gomes CamposCámara Chávez, GuillermoTodt, EduardoFerreira, Anderson AlmeidaGomes, David Menotti2020-08-11T19:11:49Z2020-08-11T19:11:49Z2017PEIXOTO, Sirlene Pio Gomes da Silva. Reconhecimento de caracteres em imagens com ruído usando Deep Learning. 2017. 60 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.http://www.repositorio.ufop.br/handle/123456789/12579Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Devido à degradação e baixa qualidade em imagens com ruído, como imagens de cenas naturais e CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart) baseados em texto, o problema de reconhecimento de caracteres continua a ser extremamente desafiador. Neste trabalho, estudamos três abordagens diferentes de redes convolucionais (otimização de arquitetura com filtros aleatórios, aprendizado de filtros não supervisionado e supervisionado) que visam melhorar as representações de característica dessas imagens por meio de deep learning. Nós realizamos experimentos no amplamente utilizado dataset The Street View House Numbers (SVHN), em um novo dataset de CAPTCHAS criado por nós, e em um dataset de placas brasileiras. A abordagem que aprende os pesos dos filtros por meio do algoritmo back-propagation utilizando a técnica data augmentation e a estratégia de agregação de algumas camadas localmente conectadas à rede convolucional obteve resultados promissores para o dataset CAPTCHA (97,36% de acurácia para caracteres e 85,4% para CAPTCHAs) e resultados muito próximos ao estado da arte em relação ao dataset SVHN (97,45 % de acurácia para dígitos). Já no dataset de placas brasileiras, que contém um número de amostras muito inferior aos demais, a abordagem que realiza a otimização de arquitetura com filtros aleatórios obteve os resultados mais promissores. Além disso, analisamos o comportamento da abordagem deep learning que realiza o aprendizado supervisionado de filtros diante da exposição do dataset SVHN a interferências adversas.Due to degradation and low quality in noisy images, such as natural scene images and CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart) based on text, the character recognition problem continues to be extremely challenging. In this work, we study two different convolutional network approaches (architecture optimization with random filters, filters learning unsupervised and supervised) aiming at improving the feature representations of these images through deep learning. We perform experiments in the widely used Street View House Numbers (SVHN) dataset, in a new dataset of CAPTCHAS created by us and a dataset of Brazilian plates. The approach that learns filter weights through back-propagation algorithm using data augmentation technique and the strategy of adding few locally-connected layers to the Convolutional Network (CN) has obtained promising results to the CAPTCHA dataset (97.36% of accuracy for characters and 85.4% for CAPTCHAs) and results very close to the state-of-the-art regarding the SVHN dataset (97.45% of accuracy for digits). In dataset of Brazilian plates, which contains a number of very low samples to the other, an approach that optimizes the architecture with random filters achieved the most promising results. In addition, we analyze the behavior of the deep learning approach we perform the supervised learning of filters in the face of SVHN dataset exposure to adverse interference.Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 06/08/2020 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais.info:eu-repo/semantics/openAccessRedes neurais - computaçãoInteligência artificialAprendizado do computadorReconhecimento de caracteres em imagens com ruído usando Deep Learning.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-8924http://www.repositorio.ufop.br/bitstream/123456789/12579/5/license.txt62604f8d955274beb56c80ce1ee5dcaeMD55CC-LICENSElicense_urllicense_urltext/plain; charset=utf-846http://www.repositorio.ufop.br/bitstream/123456789/12579/2/license_url486e70aa6e7b0271de4953c01c4283fdMD52license_textlicense_texttext/html; charset=utf-80http://www.repositorio.ufop.br/bitstream/123456789/12579/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://www.repositorio.ufop.br/bitstream/123456789/12579/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDISSERTAÇÃO_ReconhecimentoCaracteresImagem.pdfDISSERTAÇÃO_ReconhecimentoCaracteresImagem.pdfapplication/pdf23966156http://www.repositorio.ufop.br/bitstream/123456789/12579/1/DISSERTA%c3%87%c3%83O_ReconhecimentoCaracteresImagem.pdf4fe80b4fc315756a11266a9d0a3b7cf6MD51123456789/125792020-08-11 15:11:49.513oai:localhost:123456789/12579RGVjbGFyYcOnw6NvIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhCgpPIHJlZmVyaWRvIGF1dG9yOgoKYSlEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBwZXNzb2Egb3UgZW50aWRhZGUuCgpiKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0by9VRk9QIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MsIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpjKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVUZPUCwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gY29udHJhdG8gb3UgYWNvcmRvLgoKRepositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332020-08-11T19:11:49Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false |
dc.title.pt_BR.fl_str_mv |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. |
title |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. |
spellingShingle |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. Peixoto, Sirlene Pio Gomes da Silva Redes neurais - computação Inteligência artificial Aprendizado do computador |
title_short |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. |
title_full |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. |
title_fullStr |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. |
title_full_unstemmed |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. |
title_sort |
Reconhecimento de caracteres em imagens com ruído usando Deep Learning. |
author |
Peixoto, Sirlene Pio Gomes da Silva |
author_facet |
Peixoto, Sirlene Pio Gomes da Silva |
author_role |
author |
dc.contributor.referee.pt_BR.fl_str_mv |
Gomes, David Menotti Bianchi, Andrea Gomes Campos Cámara Chávez, Guillermo Todt, Eduardo Ferreira, Anderson Almeida |
dc.contributor.author.fl_str_mv |
Peixoto, Sirlene Pio Gomes da Silva |
dc.contributor.advisor1.fl_str_mv |
Gomes, David Menotti |
contributor_str_mv |
Gomes, David Menotti |
dc.subject.por.fl_str_mv |
Redes neurais - computação Inteligência artificial Aprendizado do computador |
topic |
Redes neurais - computação Inteligência artificial Aprendizado do computador |
description |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
publishDate |
2017 |
dc.date.issued.fl_str_mv |
2017 |
dc.date.accessioned.fl_str_mv |
2020-08-11T19:11:49Z |
dc.date.available.fl_str_mv |
2020-08-11T19:11:49Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PEIXOTO, Sirlene Pio Gomes da Silva. Reconhecimento de caracteres em imagens com ruído usando Deep Learning. 2017. 60 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017. |
dc.identifier.uri.fl_str_mv |
http://www.repositorio.ufop.br/handle/123456789/12579 |
identifier_str_mv |
PEIXOTO, Sirlene Pio Gomes da Silva. Reconhecimento de caracteres em imagens com ruído usando Deep Learning. 2017. 60 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017. |
url |
http://www.repositorio.ufop.br/handle/123456789/12579 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP |
instname_str |
Universidade Federal de Ouro Preto (UFOP) |
instacron_str |
UFOP |
institution |
UFOP |
reponame_str |
Repositório Institucional da UFOP |
collection |
Repositório Institucional da UFOP |
bitstream.url.fl_str_mv |
http://www.repositorio.ufop.br/bitstream/123456789/12579/5/license.txt http://www.repositorio.ufop.br/bitstream/123456789/12579/2/license_url http://www.repositorio.ufop.br/bitstream/123456789/12579/3/license_text http://www.repositorio.ufop.br/bitstream/123456789/12579/4/license_rdf http://www.repositorio.ufop.br/bitstream/123456789/12579/1/DISSERTA%c3%87%c3%83O_ReconhecimentoCaracteresImagem.pdf |
bitstream.checksum.fl_str_mv |
62604f8d955274beb56c80ce1ee5dcae 486e70aa6e7b0271de4953c01c4283fd d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e 4fe80b4fc315756a11266a9d0a3b7cf6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP) |
repository.mail.fl_str_mv |
repositorio@ufop.edu.br |
_version_ |
1801685707968741376 |