Análise e Classificação de imagens para aplicação de OCR em cupons fiscais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFSC |
Texto Completo: | https://repositorio.ufsc.br/xmlui/handle/123456789/182212 |
Resumo: | TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. |
id |
UFSC_cd53cba9c65d29e61081a4870f6caf49 |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/182212 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscaisClassificação de Imagens, Técnicas de PDI, OCR, Cupons Fiscais.TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação.A proposta sugerida por este trabalho foi de analisar o impacto de um modelo de classificação, seguido de técnicas de PDI e OCR para extração de texto em cupons fiscais, classificando-os em subgrupos. Técnicas selecionadas de PDI foram aplicadas para cada grupo com suas devidas características, por fim extraindo texto dessas imagens através de um algoritmo de OCR. Foi realizado um estudo sobre os algoritmos clássicos de classificação na área de aprendizado de máquinas, com foco nos algoritmos de “clusterização” e sua correlação com a classificação de imagens em um modelo de aprendizado não supervisionado. Também foi feita uma análise sobre as características das imagens de cupons fiscais e das possíveis técnicas de PDI que podem ser aplicadas. Em relação ao OCR, também foi realizado um estudo para verificar possíveis soluções na extração de texto e entender seu comportamento, possibilitando desta maneira implementar a arquitetura proposta. Sendo assim, foram desenvolvidos métodos para classificar as imagens em clusters utilizando algoritmos de “clusterização”. Também foram propostas três técnicas de PDI, a primeira aplicando uma série de realces, a segunda uma binarização adaptativa e a terceira técnica utilizando a compressão de dados JPEG. Essas imagens foram enviadas para o serviço de OCR do Google Vision, onde foi possível extrair o texto das imagens em formato de blocos. Os resultados do modelo desenvolvido foram avaliados comparando a taxa de acerto do OCR com os valores de texto reais presentes nos cupons fiscais, onde foi possível analisar a precisão de cada técnica proposta e da arquitetura como um todo. Foram obtidos resultados positivos utilizando o modelo desenvolvido, melhorando a extração do valor total da compra em aproximadamente 6%. Além disso, os resultados da compressão JPEG melhoraram também a extração de outros dados do cupom fiscal, como por exemplo o CNPJ e a data da compra.Florianópolis, SC.Santos, Elder Rizzon SantosSilva, Alexandre Gonçalves SilvaUniversidade Federal de Santa CatarinaFeijó, José Victor Feijó de Araujo2017-12-13T21:10:36Z2017-12-13T21:10:36Z2017-12-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis123application/pdfhttps://repositorio.ufsc.br/xmlui/handle/123456789/182212porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2017-12-13T21:10:36Zoai:repositorio.ufsc.br:123456789/182212Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732017-12-13T21:10:36Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais |
title |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais |
spellingShingle |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais Feijó, José Victor Feijó de Araujo Classificação de Imagens, Técnicas de PDI, OCR, Cupons Fiscais. |
title_short |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais |
title_full |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais |
title_fullStr |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais |
title_full_unstemmed |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais |
title_sort |
Análise e Classificação de imagens para aplicação de OCR em cupons fiscais |
author |
Feijó, José Victor Feijó de Araujo |
author_facet |
Feijó, José Victor Feijó de Araujo |
author_role |
author |
dc.contributor.none.fl_str_mv |
Santos, Elder Rizzon Santos Silva, Alexandre Gonçalves Silva Universidade Federal de Santa Catarina |
dc.contributor.author.fl_str_mv |
Feijó, José Victor Feijó de Araujo |
dc.subject.por.fl_str_mv |
Classificação de Imagens, Técnicas de PDI, OCR, Cupons Fiscais. |
topic |
Classificação de Imagens, Técnicas de PDI, OCR, Cupons Fiscais. |
description |
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-12-13T21:10:36Z 2017-12-13T21:10:36Z 2017-12-13 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/xmlui/handle/123456789/182212 |
url |
https://repositorio.ufsc.br/xmlui/handle/123456789/182212 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
123 application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC. |
publisher.none.fl_str_mv |
Florianópolis, SC. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
|
_version_ |
1808651985082122240 |