Using a super resolution network and general-purpose optical character recognition for license plate recognition
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | eng |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/254231 |
Resumo: | Extração e identificação de placas veiculares a partir de imagens têm diversas aplica ções e podem ser utilizadas para automatizar e melhorar inúmeros processos na nossa sociedade. Além disso, usando inteligência artificial, é possível extrair informações sem interação humana, o que pode reduzir falhas, economizar recursos e aumentar o número de casos de uso aplicáveis. Nos últimos anos, diversas aplicações e estudos foram con duzidos nessa área e um problema frequente está relacionado às imagens de baixa reso lução. Dessa forma, neste trabalho, iremos descrever a implementação de um fluxo de execução para identificar placas veiculares usando redes neurais de diferentes propósi tos e endereçar esse problema em particular introduzindo uma Rede de Super Resolução de Texto. Além disso, analisamos os resultados obtidos combinando diferentes modelos de reconhecimento óptico de caracteres visando aumentar a acurácia e robusteza do sis tema. Nossos resultados experimentais indicam que as abordagens de OCR pré-treinadas têm um desempenho muito ruim no reconhecimento de placas, mas realizar o fine-tuning com imagens de placas melhora consideravelmente os resultados. A técnica TSRN teve um desempenho satisfatório e produziu imagens de alta resolução bem definidas, mas a precisão geral do OCR apresentou um ganho marginal. Acreditamos que o problema de baixa resolução que estávamos tentando resolver com essa rede não era o crítico em nosso conjunto de dados de teste. |
id |
UFRGS-2_c5d3b0ba7fc5c21b4385cd45489fe5a7 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/254231 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Lima, Cleiton SouzaJung, Claudio Rosito2023-02-07T05:02:05Z2022http://hdl.handle.net/10183/254231001158698Extração e identificação de placas veiculares a partir de imagens têm diversas aplica ções e podem ser utilizadas para automatizar e melhorar inúmeros processos na nossa sociedade. Além disso, usando inteligência artificial, é possível extrair informações sem interação humana, o que pode reduzir falhas, economizar recursos e aumentar o número de casos de uso aplicáveis. Nos últimos anos, diversas aplicações e estudos foram con duzidos nessa área e um problema frequente está relacionado às imagens de baixa reso lução. Dessa forma, neste trabalho, iremos descrever a implementação de um fluxo de execução para identificar placas veiculares usando redes neurais de diferentes propósi tos e endereçar esse problema em particular introduzindo uma Rede de Super Resolução de Texto. Além disso, analisamos os resultados obtidos combinando diferentes modelos de reconhecimento óptico de caracteres visando aumentar a acurácia e robusteza do sis tema. Nossos resultados experimentais indicam que as abordagens de OCR pré-treinadas têm um desempenho muito ruim no reconhecimento de placas, mas realizar o fine-tuning com imagens de placas melhora consideravelmente os resultados. A técnica TSRN teve um desempenho satisfatório e produziu imagens de alta resolução bem definidas, mas a precisão geral do OCR apresentou um ganho marginal. Acreditamos que o problema de baixa resolução que estávamos tentando resolver com essa rede não era o crítico em nosso conjunto de dados de teste.The extraction and identification of license plates from images have numerous applica tions and can be used to automate and improve various processes in our society. By using artificial intelligence, we can extract information without human interaction, reducing er rors, saving resources, and increasing the number of applicable use cases. In recent years, several applications and studies have been conducted in this area, and a common problem is the low resolution of images. In this monograph, we describe the implementation of a license plate identification pipeline using neural networks for different purposes and ad dress this particular problem by introducing a Text Super-Resolution Network (TSRN). Besides that, we analyze the results by combining different optical character recognition (OCR) modules aiming to increase the system accuracy and robustness. Our experimental results indicate that pre-trained OCR approaches perform very poorly for recognizing li cense plates, but fine-tuning them with license plate images strongly improves the results. TSRN performed satisfactorily and produced well-defined high-resolution image, but the overall OCR accuracy presented a marginal gain. We believe that the low-resolution prob lem we were trying to solve with this network was not the critical one in our test datasetapplication/pdfengRede neural artificialAprendizagem : MaquinaPlacas veicularesAutomatic License Plate RecognitionSuper Resolution Neural NetworkLow Resolution ImagesOptical Character RecognitionUsing a super resolution network and general-purpose optical character recognition for license plate recognitionUsando uma rede de super resolução e reconhecimento ótico de caracteres de propósito geral para reconhecimento de placas veiculares info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2022Ciência da Computação: Ênfase em Ciência da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001158698.pdf.txt001158698.pdf.txtExtracted Texttext/plain66985http://www.lume.ufrgs.br/bitstream/10183/254231/2/001158698.pdf.txt2ea9a56e9fec3051acaa7675fd22f8d8MD52ORIGINAL001158698.pdfTexto completo (inglês)application/pdf15514132http://www.lume.ufrgs.br/bitstream/10183/254231/1/001158698.pdf0e3bfe8915026bef07720d093da0fe92MD5110183/2542312023-03-12 03:23:56.940579oai:www.lume.ufrgs.br:10183/254231Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-03-12T06:23:56Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Using a super resolution network and general-purpose optical character recognition for license plate recognition |
dc.title.alternative.en.fl_str_mv |
Usando uma rede de super resolução e reconhecimento ótico de caracteres de propósito geral para reconhecimento de placas veiculares |
title |
Using a super resolution network and general-purpose optical character recognition for license plate recognition |
spellingShingle |
Using a super resolution network and general-purpose optical character recognition for license plate recognition Lima, Cleiton Souza Rede neural artificial Aprendizagem : Maquina Placas veiculares Automatic License Plate Recognition Super Resolution Neural Network Low Resolution Images Optical Character Recognition |
title_short |
Using a super resolution network and general-purpose optical character recognition for license plate recognition |
title_full |
Using a super resolution network and general-purpose optical character recognition for license plate recognition |
title_fullStr |
Using a super resolution network and general-purpose optical character recognition for license plate recognition |
title_full_unstemmed |
Using a super resolution network and general-purpose optical character recognition for license plate recognition |
title_sort |
Using a super resolution network and general-purpose optical character recognition for license plate recognition |
author |
Lima, Cleiton Souza |
author_facet |
Lima, Cleiton Souza |
author_role |
author |
dc.contributor.author.fl_str_mv |
Lima, Cleiton Souza |
dc.contributor.advisor1.fl_str_mv |
Jung, Claudio Rosito |
contributor_str_mv |
Jung, Claudio Rosito |
dc.subject.por.fl_str_mv |
Rede neural artificial Aprendizagem : Maquina Placas veiculares |
topic |
Rede neural artificial Aprendizagem : Maquina Placas veiculares Automatic License Plate Recognition Super Resolution Neural Network Low Resolution Images Optical Character Recognition |
dc.subject.eng.fl_str_mv |
Automatic License Plate Recognition Super Resolution Neural Network Low Resolution Images Optical Character Recognition |
description |
Extração e identificação de placas veiculares a partir de imagens têm diversas aplica ções e podem ser utilizadas para automatizar e melhorar inúmeros processos na nossa sociedade. Além disso, usando inteligência artificial, é possível extrair informações sem interação humana, o que pode reduzir falhas, economizar recursos e aumentar o número de casos de uso aplicáveis. Nos últimos anos, diversas aplicações e estudos foram con duzidos nessa área e um problema frequente está relacionado às imagens de baixa reso lução. Dessa forma, neste trabalho, iremos descrever a implementação de um fluxo de execução para identificar placas veiculares usando redes neurais de diferentes propósi tos e endereçar esse problema em particular introduzindo uma Rede de Super Resolução de Texto. Além disso, analisamos os resultados obtidos combinando diferentes modelos de reconhecimento óptico de caracteres visando aumentar a acurácia e robusteza do sis tema. Nossos resultados experimentais indicam que as abordagens de OCR pré-treinadas têm um desempenho muito ruim no reconhecimento de placas, mas realizar o fine-tuning com imagens de placas melhora consideravelmente os resultados. A técnica TSRN teve um desempenho satisfatório e produziu imagens de alta resolução bem definidas, mas a precisão geral do OCR apresentou um ganho marginal. Acreditamos que o problema de baixa resolução que estávamos tentando resolver com essa rede não era o crítico em nosso conjunto de dados de teste. |
publishDate |
2022 |
dc.date.issued.fl_str_mv |
2022 |
dc.date.accessioned.fl_str_mv |
2023-02-07T05:02:05Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/254231 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001158698 |
url |
http://hdl.handle.net/10183/254231 |
identifier_str_mv |
001158698 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/254231/2/001158698.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/254231/1/001158698.pdf |
bitstream.checksum.fl_str_mv |
2ea9a56e9fec3051acaa7675fd22f8d8 0e3bfe8915026bef07720d093da0fe92 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1801224650731028480 |