Reconhecimento de caracteres em imagens com ruído usando Deep Learning.

Peixoto, Sirlene Pio Gomes da Silva

Reconhecimento de caracteres em imagens com ruído usando Deep Learning.

Detalhes bibliográficos
Autor(a) principal:	Peixoto, Sirlene Pio Gomes da Silva
Data de Publicação:	2017
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Institucional da UFOP
Texto Completo:	http://www.repositorio.ufop.br/handle/123456789/12579
Resumo:	Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.

Metadados do item

id	UFOP_740f4c520e598511b79b7d2814294c06
oai_identifier_str	oai:localhost:123456789/12579
network_acronym_str	UFOP
network_name_str	Repositório Institucional da UFOP
repository_id_str	3233
spelling	Peixoto, Sirlene Pio Gomes da SilvaGomes, David MenottiBianchi, Andrea Gomes CamposCámara Chávez, GuillermoTodt, EduardoFerreira, Anderson AlmeidaGomes, David Menotti2020-08-11T19:11:49Z2020-08-11T19:11:49Z2017PEIXOTO, Sirlene Pio Gomes da Silva. Reconhecimento de caracteres em imagens com ruído usando Deep Learning. 2017. 60 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.http://www.repositorio.ufop.br/handle/123456789/12579Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Devido à degradação e baixa qualidade em imagens com ruído, como imagens de cenas naturais e CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart) baseados em texto, o problema de reconhecimento de caracteres continua a ser extremamente desafiador. Neste trabalho, estudamos três abordagens diferentes de redes convolucionais (otimização de arquitetura com filtros aleatórios, aprendizado de filtros não supervisionado e supervisionado) que visam melhorar as representações de característica dessas imagens por meio de deep learning. Nós realizamos experimentos no amplamente utilizado dataset The Street View House Numbers (SVHN), em um novo dataset de CAPTCHAS criado por nós, e em um dataset de placas brasileiras. A abordagem que aprende os pesos dos filtros por meio do algoritmo back-propagation utilizando a técnica data augmentation e a estratégia de agregação de algumas camadas localmente conectadas à rede convolucional obteve resultados promissores para o dataset CAPTCHA (97,36% de acurácia para caracteres e 85,4% para CAPTCHAs) e resultados muito próximos ao estado da arte em relação ao dataset SVHN (97,45 % de acurácia para dígitos). Já no dataset de placas brasileiras, que contém um número de amostras muito inferior aos demais, a abordagem que realiza a otimização de arquitetura com filtros aleatórios obteve os resultados mais promissores. Além disso, analisamos o comportamento da abordagem deep learning que realiza o aprendizado supervisionado de filtros diante da exposição do dataset SVHN a interferências adversas.Due to degradation and low quality in noisy images, such as natural scene images and CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart) based on text, the character recognition problem continues to be extremely challenging. In this work, we study two different convolutional network approaches (architecture optimization with random filters, filters learning unsupervised and supervised) aiming at improving the feature representations of these images through deep learning. We perform experiments in the widely used Street View House Numbers (SVHN) dataset, in a new dataset of CAPTCHAS created by us and a dataset of Brazilian plates. The approach that learns filter weights through back-propagation algorithm using data augmentation technique and the strategy of adding few locally-connected layers to the Convolutional Network (CN) has obtained promising results to the CAPTCHA dataset (97.36% of accuracy for characters and 85.4% for CAPTCHAs) and results very close to the state-of-the-art regarding the SVHN dataset (97.45% of accuracy for digits). In dataset of Brazilian plates, which contains a number of very low samples to the other, an approach that optimizes the architecture with random filters achieved the most promising results. In addition, we analyze the behavior of the deep learning approach we perform the supervised learning of filters in the face of SVHN dataset exposure to adverse interference.Autorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 06/08/2020 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais.info:eu-repo/semantics/openAccessRedes neurais - computaçãoInteligência artificialAprendizado do computadorReconhecimento de caracteres em imagens com ruído usando Deep Learning.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOPLICENSElicense.txtlicense.txttext/plain; charset=utf-8924http://www.repositorio.ufop.br/bitstream/123456789/12579/5/license.txt62604f8d955274beb56c80ce1ee5dcaeMD55CC-LICENSElicense_urllicense_urltext/plain; charset=utf-846http://www.repositorio.ufop.br/bitstream/123456789/12579/2/license_url486e70aa6e7b0271de4953c01c4283fdMD52license_textlicense_texttext/html; charset=utf-80http://www.repositorio.ufop.br/bitstream/123456789/12579/3/license_textd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80http://www.repositorio.ufop.br/bitstream/123456789/12579/4/license_rdfd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDISSERTAÇÃO_ReconhecimentoCaracteresImagem.pdfDISSERTAÇÃO_ReconhecimentoCaracteresImagem.pdfapplication/pdf23966156http://www.repositorio.ufop.br/bitstream/123456789/12579/1/DISSERTA%c3%87%c3%83O_ReconhecimentoCaracteresImagem.pdf4fe80b4fc315756a11266a9d0a3b7cf6MD51123456789/125792020-08-11 15:11:49.513oai:localhost:123456789/12579RGVjbGFyYcOnw6NvIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhCgpPIHJlZmVyaWRvIGF1dG9yOgoKYSlEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBwZXNzb2Egb3UgZW50aWRhZGUuCgpiKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgT3VybyBQcmV0by9VRk9QIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MsIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpjKVNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVUZPUCwgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gY29udHJhdG8gb3UgYWNvcmRvLgoKRepositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332020-08-11T19:11:49Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false
dc.title.pt_BR.fl_str_mv	Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
title	Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
spellingShingle	Reconhecimento de caracteres em imagens com ruído usando Deep Learning. Peixoto, Sirlene Pio Gomes da Silva Redes neurais - computação Inteligência artificial Aprendizado do computador
title_short	Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
title_full	Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
title_fullStr	Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
title_full_unstemmed	Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
title_sort	Reconhecimento de caracteres em imagens com ruído usando Deep Learning.
author	Peixoto, Sirlene Pio Gomes da Silva
author_facet	Peixoto, Sirlene Pio Gomes da Silva
author_role	author
dc.contributor.referee.pt_BR.fl_str_mv	Gomes, David Menotti Bianchi, Andrea Gomes Campos Cámara Chávez, Guillermo Todt, Eduardo Ferreira, Anderson Almeida
dc.contributor.author.fl_str_mv	Peixoto, Sirlene Pio Gomes da Silva
dc.contributor.advisor1.fl_str_mv	Gomes, David Menotti
contributor_str_mv	Gomes, David Menotti
dc.subject.por.fl_str_mv	Redes neurais - computação Inteligência artificial Aprendizado do computador
topic	Redes neurais - computação Inteligência artificial Aprendizado do computador
description	Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
publishDate	2017
dc.date.issued.fl_str_mv	2017
dc.date.accessioned.fl_str_mv	2020-08-11T19:11:49Z
dc.date.available.fl_str_mv	2020-08-11T19:11:49Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.citation.fl_str_mv	PEIXOTO, Sirlene Pio Gomes da Silva. Reconhecimento de caracteres em imagens com ruído usando Deep Learning. 2017. 60 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.
dc.identifier.uri.fl_str_mv	http://www.repositorio.ufop.br/handle/123456789/12579
identifier_str_mv	PEIXOTO, Sirlene Pio Gomes da Silva. Reconhecimento de caracteres em imagens com ruído usando Deep Learning. 2017. 60 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2017.
url	http://www.repositorio.ufop.br/handle/123456789/12579
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP
instname_str	Universidade Federal de Ouro Preto (UFOP)
instacron_str	UFOP
institution	UFOP
reponame_str	Repositório Institucional da UFOP
collection	Repositório Institucional da UFOP
bitstream.url.fl_str_mv	http://www.repositorio.ufop.br/bitstream/123456789/12579/5/license.txt http://www.repositorio.ufop.br/bitstream/123456789/12579/2/license_url http://www.repositorio.ufop.br/bitstream/123456789/12579/3/license_text http://www.repositorio.ufop.br/bitstream/123456789/12579/4/license_rdf http://www.repositorio.ufop.br/bitstream/123456789/12579/1/DISSERTA%c3%87%c3%83O_ReconhecimentoCaracteresImagem.pdf
bitstream.checksum.fl_str_mv	62604f8d955274beb56c80ce1ee5dcae 486e70aa6e7b0271de4953c01c4283fd d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e 4fe80b4fc315756a11266a9d0a3b7cf6
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)
repository.mail.fl_str_mv	repositorio@ufop.edu.br
_version_	1801685707968741376

Reconhecimento de caracteres em imagens com ruído usando Deep Learning.

Registros relacionados