Identificação de escritores usando CNN's com abordagem de dissimilaridade
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) |
Texto Completo: | http://repositorio.uem.br:8080/jspui/handle/1/5361 |
Resumo: | The writer identification using handwritten documents has become an important research topic in documents forensics analysis. That is because it can be used as an identifying characteristic of a person. There are several databases composed of handwritten documents available for research, using different languages and alphabets. To obtain the objectives of this work, the following databases were utilized: CVL and BFL both used for single-script, for documents written in the same alphabet and the LAMIS-MSHD database which is built for multi-script, that is, documents written with differents alphabets. Besides that, several techniques were applied in writer identification process. The objective of this work is to evaluate the performance of the artificial intelligence technique known as Convolutional Neural Network (CNN) in writer identification utilizing handwritten documents. For this, a CNN will be used for the classification of the writers, also for feature extraction that will be evaluated in the SVM classifier and dissimilarity procedures are to be applied. Initially, experiments were developed using the traditional pattern recognition approach, based on feature engineering (or handcrafted features). In these experiments, the texture generation is done from the original documents and later, the features were extracted with the texture descriptors LBP and LPQ. Furthermore, the impact of the classification in the SVM was evaluated with and without the use of the dissimilarity approach, obtaining through combination rules of classifiers, a consensual decision in relation to the final decision. After a series of experiments, the approach with feature dissimilarity obtained through CNN, presented superior results in relation to the literature |
id |
UEM-10_9aaf0a25db0d64a857945f046136bec6 |
---|---|
oai_identifier_str |
oai:localhost:1/5361 |
network_acronym_str |
UEM-10 |
network_name_str |
Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) |
repository_id_str |
|
spelling |
Identificação de escritores usando CNN's com abordagem de dissimilaridadeConvolutional Neural Network (CNN)Inteligência artificialRede neuralCNPQ::CIENCIAS EXATAS E DA TERRACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe writer identification using handwritten documents has become an important research topic in documents forensics analysis. That is because it can be used as an identifying characteristic of a person. There are several databases composed of handwritten documents available for research, using different languages and alphabets. To obtain the objectives of this work, the following databases were utilized: CVL and BFL both used for single-script, for documents written in the same alphabet and the LAMIS-MSHD database which is built for multi-script, that is, documents written with differents alphabets. Besides that, several techniques were applied in writer identification process. The objective of this work is to evaluate the performance of the artificial intelligence technique known as Convolutional Neural Network (CNN) in writer identification utilizing handwritten documents. For this, a CNN will be used for the classification of the writers, also for feature extraction that will be evaluated in the SVM classifier and dissimilarity procedures are to be applied. Initially, experiments were developed using the traditional pattern recognition approach, based on feature engineering (or handcrafted features). In these experiments, the texture generation is done from the original documents and later, the features were extracted with the texture descriptors LBP and LPQ. Furthermore, the impact of the classification in the SVM was evaluated with and without the use of the dissimilarity approach, obtaining through combination rules of classifiers, a consensual decision in relation to the final decision. After a series of experiments, the approach with feature dissimilarity obtained through CNN, presented superior results in relation to the literatureA identificação de escritores utilizando manuscritos tornou-se um tema importante de pesquisa para análise de documentos forenses, assim, a escrita pode ser considerada uma característica usada para distinguir uma pessoa. Existem diferentes bases de dados de escritores utilizando manuscritos e contendo diferentes alfabetos. Para atingir os objetivos deste trabalho, foram utilizadas as bases de dados: CVL e a BFL ambas sendo single-script, com documentos escritos no mesmo alfabeto, e a base LAMIS-MSHD que é multi-script, ou seja, escritas em diferentes alfabetos. Além disso, várias técnicas foram aplicadas no processo de identificação de escritores. Portanto, o objetivo deste trabalho é avaliar o desempenho da técnica de inteligência artificial conhecida como Convolutional Neural Network (CNN) na identificação de escritores utilizando manuscritos. Assim, será utilizada uma CNN tanto para a classificação dos escritores, quanto para extração de características que serão submetidas ao classificador SVM e também aplicado a dissimilaridade para novos experimentos. Inicialmente, foram desenvolvidos experimentos utilizando-se a abordagem tradicional de reconhecimento de padrões, baseada na engenharia de características (ou handcraftedfeatures). Nestes experimentos, foi utilizado a geração de textura a partir dos documentos originais e posteriormente, foram extraídas as características com os descritores de textura LBP e LPQ. Assim, avaliado o impacto da classificação no SVM com e sem o uso da abordagem de dissimilaridade, obtendo com regras de combinação de classificadores uma decisão consensual em relação à decisão final. Depois de uma série de experimentos, a abordagem com dissimilaridade nas características obtidas por meio da CNN, apresentou resultados superiores em relação à literaturaUniversidade Estadual de MaringáBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUEMMaringaCentro de Ciências de TecnologiaGonçalves, Diego BertolinHelal, Lucas Georges2019-06-15T13:18:30Z2019-06-15T13:18:30Z2019-02-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisHELAL, Lucas Georges. Identificação de escritores usando CNN's com abordagem de dissimilaridade. 2019. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, Centro de Tecnologia, Departamento de Informática, 2019, Maringá, PR.http://repositorio.uem.br:8080/jspui/handle/1/5361porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)instname:Universidade Estadual de Maringá (UEM)instacron:UEM2019-06-15T13:18:30Zoai:localhost:1/5361Repositório InstitucionalPUBhttp://repositorio.uem.br:8080/oai/requestopendoar:2024-04-23T14:58:33.005620Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)false |
dc.title.none.fl_str_mv |
Identificação de escritores usando CNN's com abordagem de dissimilaridade |
title |
Identificação de escritores usando CNN's com abordagem de dissimilaridade |
spellingShingle |
Identificação de escritores usando CNN's com abordagem de dissimilaridade Helal, Lucas Georges Convolutional Neural Network (CNN) Inteligência artificial Rede neural CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Identificação de escritores usando CNN's com abordagem de dissimilaridade |
title_full |
Identificação de escritores usando CNN's com abordagem de dissimilaridade |
title_fullStr |
Identificação de escritores usando CNN's com abordagem de dissimilaridade |
title_full_unstemmed |
Identificação de escritores usando CNN's com abordagem de dissimilaridade |
title_sort |
Identificação de escritores usando CNN's com abordagem de dissimilaridade |
author |
Helal, Lucas Georges |
author_facet |
Helal, Lucas Georges |
author_role |
author |
dc.contributor.none.fl_str_mv |
Gonçalves, Diego Bertolin |
dc.contributor.author.fl_str_mv |
Helal, Lucas Georges |
dc.subject.por.fl_str_mv |
Convolutional Neural Network (CNN) Inteligência artificial Rede neural CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Convolutional Neural Network (CNN) Inteligência artificial Rede neural CNPQ::CIENCIAS EXATAS E DA TERRA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
The writer identification using handwritten documents has become an important research topic in documents forensics analysis. That is because it can be used as an identifying characteristic of a person. There are several databases composed of handwritten documents available for research, using different languages and alphabets. To obtain the objectives of this work, the following databases were utilized: CVL and BFL both used for single-script, for documents written in the same alphabet and the LAMIS-MSHD database which is built for multi-script, that is, documents written with differents alphabets. Besides that, several techniques were applied in writer identification process. The objective of this work is to evaluate the performance of the artificial intelligence technique known as Convolutional Neural Network (CNN) in writer identification utilizing handwritten documents. For this, a CNN will be used for the classification of the writers, also for feature extraction that will be evaluated in the SVM classifier and dissimilarity procedures are to be applied. Initially, experiments were developed using the traditional pattern recognition approach, based on feature engineering (or handcrafted features). In these experiments, the texture generation is done from the original documents and later, the features were extracted with the texture descriptors LBP and LPQ. Furthermore, the impact of the classification in the SVM was evaluated with and without the use of the dissimilarity approach, obtaining through combination rules of classifiers, a consensual decision in relation to the final decision. After a series of experiments, the approach with feature dissimilarity obtained through CNN, presented superior results in relation to the literature |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-06-15T13:18:30Z 2019-06-15T13:18:30Z 2019-02-22 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
HELAL, Lucas Georges. Identificação de escritores usando CNN's com abordagem de dissimilaridade. 2019. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, Centro de Tecnologia, Departamento de Informática, 2019, Maringá, PR. http://repositorio.uem.br:8080/jspui/handle/1/5361 |
identifier_str_mv |
HELAL, Lucas Georges. Identificação de escritores usando CNN's com abordagem de dissimilaridade. 2019. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, Centro de Tecnologia, Departamento de Informática, 2019, Maringá, PR. |
url |
http://repositorio.uem.br:8080/jspui/handle/1/5361 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Estadual de Maringá Brasil Programa de Pós-Graduação em Ciência da Computação UEM Maringa Centro de Ciências de Tecnologia |
publisher.none.fl_str_mv |
Universidade Estadual de Maringá Brasil Programa de Pós-Graduação em Ciência da Computação UEM Maringa Centro de Ciências de Tecnologia |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) instname:Universidade Estadual de Maringá (UEM) instacron:UEM |
instname_str |
Universidade Estadual de Maringá (UEM) |
instacron_str |
UEM |
institution |
UEM |
reponame_str |
Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) |
collection |
Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM) |
repository.mail.fl_str_mv |
|
_version_ |
1801841428816461824 |