Efficient acquisition and synthesis in computerized handwriting

Detalhes bibliográficos
Autor(a) principal: Balreira, Dennis Giovani
Data de Publicação: 2019
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/206318
Resumo: Apesar de hoje em dia ser comum trabalhar durante quase todo tempo com textos escritos digitalmente, escrever textos à mão possui um status especial em casos específicos. Ainda é comum que pessoas aprendam a escrever à mão desde pequenas, inclusive sendo uma das formas mais conhecidas de identificação pessoal ao longo da vida. A área de escrita à mão computadorizada provê soluções nos seus três campos principais: aquisição, reconhecimento e síntese. Em particular, a área de síntese de caligrafia é responsável por gerar textos utilizando modelos matemáticos de forma que pareçam ter sido feitos por alguém à mão. Esta área possui diversos usos, sendo eles artísticos, na produção de novos CAPTCHAS e até mesmo servindo como novas entradas para o reconhecimento de escrita à mão. Ainda é um campo desafiador, pois é muito difícil imitar uma escrita à mão devido a características individuais. A maioria dos trabalhos atuais dessa área apresentam abordagens com técnicas complexas, como redes neurais, as quais necessitam de um grande número de amostras e lidam com longos problemas de otimização. Embora estas técnicas gerem bons resultados, também requerem uma grande quantidade de recursos, os quais na maioria das vezes se tornam não triviais para uso cotidiano. Nesta tese são exploradas novas abordagens para caligrafia computadorizada. Primeiramente, na área de aquisição, é apresentada uma investigação sobre o número de amostras necessárias para reproduzir variabilidade natural. É apresentado que amostras coletadas de um conjunto mínimo são estatisticamente equivalentes em variação quando comparadas a conjuntos maiores. Esta descoberta possui diversos benefícios, tais como tempo menor para coletar as amostras. Além disso, foi utilizado um dispositivo especial que captura a escrita à mão de usuários utilizando papel e caneta comum sem introduzir distorção dos tablets. Na área de síntese é apresentada uma nova técnica para gerar escrita à mão a partir de fontes públicas. Dado um texto de entrada digitalizado, é apresentado um algoritmo que encontra a forma mais similar entre diferentes caracteres utilizando para saída de dados uma grande coleção de fontes disponíveis publicamente. Nossos resultados mostram que, apesar da caligrafia humana ser altamente individual e específica, é possível obter bons resultados com baixo custo computacional, sendo útil para aplicações que não necessitam de alta similaridade.
id URGS_6fa8b434f89e9360f218b100c495f7a4
oai_identifier_str oai:www.lume.ufrgs.br:10183/206318
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Balreira, Dennis GiovaniWalter, Marcelo2020-02-28T04:06:53Z2019http://hdl.handle.net/10183/206318001112149Apesar de hoje em dia ser comum trabalhar durante quase todo tempo com textos escritos digitalmente, escrever textos à mão possui um status especial em casos específicos. Ainda é comum que pessoas aprendam a escrever à mão desde pequenas, inclusive sendo uma das formas mais conhecidas de identificação pessoal ao longo da vida. A área de escrita à mão computadorizada provê soluções nos seus três campos principais: aquisição, reconhecimento e síntese. Em particular, a área de síntese de caligrafia é responsável por gerar textos utilizando modelos matemáticos de forma que pareçam ter sido feitos por alguém à mão. Esta área possui diversos usos, sendo eles artísticos, na produção de novos CAPTCHAS e até mesmo servindo como novas entradas para o reconhecimento de escrita à mão. Ainda é um campo desafiador, pois é muito difícil imitar uma escrita à mão devido a características individuais. A maioria dos trabalhos atuais dessa área apresentam abordagens com técnicas complexas, como redes neurais, as quais necessitam de um grande número de amostras e lidam com longos problemas de otimização. Embora estas técnicas gerem bons resultados, também requerem uma grande quantidade de recursos, os quais na maioria das vezes se tornam não triviais para uso cotidiano. Nesta tese são exploradas novas abordagens para caligrafia computadorizada. Primeiramente, na área de aquisição, é apresentada uma investigação sobre o número de amostras necessárias para reproduzir variabilidade natural. É apresentado que amostras coletadas de um conjunto mínimo são estatisticamente equivalentes em variação quando comparadas a conjuntos maiores. Esta descoberta possui diversos benefícios, tais como tempo menor para coletar as amostras. Além disso, foi utilizado um dispositivo especial que captura a escrita à mão de usuários utilizando papel e caneta comum sem introduzir distorção dos tablets. Na área de síntese é apresentada uma nova técnica para gerar escrita à mão a partir de fontes públicas. Dado um texto de entrada digitalizado, é apresentado um algoritmo que encontra a forma mais similar entre diferentes caracteres utilizando para saída de dados uma grande coleção de fontes disponíveis publicamente. Nossos resultados mostram que, apesar da caligrafia humana ser altamente individual e específica, é possível obter bons resultados com baixo custo computacional, sendo útil para aplicações que não necessitam de alta similaridade.Although nowadays people rely almost full time on digital text, the use of handwriting has earned a special status for specific cases. We still learn to write by hand and use it as an identifying tool throughout our entire life. The computerized handwriting area addresses solutions in the three main handwritten fields: acquisition, recognition, and synthesis. In particular, handwriting synthesis generates renderings of text which resemble natural handwriting but are, in fact, synthesized by a model. The results in this area have several uses, such as artistic applications, CAPTCHA generation, and by providing new examples for handwriting recognition. It is still a challenging research area since it is challenging to mimic natural handwriting due to individual characteristics. Most of the current research in the field present robust approaches with sophisticated techniques, such as neural networks, which require a large number of samples and deal with large time-consuming optimization problems. Although they produce natural-looking results overall, these techniques require a large number of resources, which most of the time make them non-trivial for daily usage. In this thesis, we introduce two main contributions to computerized handwriting. First, in the acquisition field, we present an in-depth look investigating the number of samples needed for reproducing natural variability. We show that writing samples collected from a minimal set are statistically equivalent in variation with larger sets. This discovery provides many benefits, such as the shorter time needed to collect the samples. Our samples were collected from a special tablet device that captures the users handwriting using pen and paper, without introducing typical distortion produced by graphics tablets. Second, in the synthesis area, we introduce a novel technique to generate handwriting from public fonts. Given a digitalized input sample of the desired handwriting, we present an algorithm that finds the best match between characters using as a source for the output text the extensive collection of publicly available fonts designed to look like handwriting. Our results show that even though human calligraphy is highly individual and specialized, visually similar renderings are possible for many applications that do not demand full similarity, considerably increasing its synthesis variability from a few inputs without the complexity of state-of-the-art approaches.application/pdfengComputação gráficaProcessamento de imagensCaligrafiaComputer graphicsimage processinghandwriting synthesishandwriting acquisitioncharacter comparisonEfficient acquisition and synthesis in computerized handwritingAquisição e síntese eficientes em caligrafia computadorizada info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2019doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001112149.pdf.txt001112149.pdf.txtExtracted Texttext/plain164319http://www.lume.ufrgs.br/bitstream/10183/206318/2/001112149.pdf.txt3bac9f78c0a845b38b3fdfeb7462b2c2MD52ORIGINAL001112149.pdfTexto completo (inglês)application/pdf14363134http://www.lume.ufrgs.br/bitstream/10183/206318/1/001112149.pdf22be484fed5da6ec98314e0f1591cc68MD5110183/2063182021-05-26 04:41:59.494879oai:www.lume.ufrgs.br:10183/206318Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:41:59Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Efficient acquisition and synthesis in computerized handwriting
dc.title.alternative.pt.fl_str_mv Aquisição e síntese eficientes em caligrafia computadorizada
title Efficient acquisition and synthesis in computerized handwriting
spellingShingle Efficient acquisition and synthesis in computerized handwriting
Balreira, Dennis Giovani
Computação gráfica
Processamento de imagens
Caligrafia
Computer graphics
image processing
handwriting synthesis
handwriting acquisition
character comparison
title_short Efficient acquisition and synthesis in computerized handwriting
title_full Efficient acquisition and synthesis in computerized handwriting
title_fullStr Efficient acquisition and synthesis in computerized handwriting
title_full_unstemmed Efficient acquisition and synthesis in computerized handwriting
title_sort Efficient acquisition and synthesis in computerized handwriting
author Balreira, Dennis Giovani
author_facet Balreira, Dennis Giovani
author_role author
dc.contributor.author.fl_str_mv Balreira, Dennis Giovani
dc.contributor.advisor1.fl_str_mv Walter, Marcelo
contributor_str_mv Walter, Marcelo
dc.subject.por.fl_str_mv Computação gráfica
Processamento de imagens
Caligrafia
topic Computação gráfica
Processamento de imagens
Caligrafia
Computer graphics
image processing
handwriting synthesis
handwriting acquisition
character comparison
dc.subject.eng.fl_str_mv Computer graphics
image processing
handwriting synthesis
handwriting acquisition
character comparison
description Apesar de hoje em dia ser comum trabalhar durante quase todo tempo com textos escritos digitalmente, escrever textos à mão possui um status especial em casos específicos. Ainda é comum que pessoas aprendam a escrever à mão desde pequenas, inclusive sendo uma das formas mais conhecidas de identificação pessoal ao longo da vida. A área de escrita à mão computadorizada provê soluções nos seus três campos principais: aquisição, reconhecimento e síntese. Em particular, a área de síntese de caligrafia é responsável por gerar textos utilizando modelos matemáticos de forma que pareçam ter sido feitos por alguém à mão. Esta área possui diversos usos, sendo eles artísticos, na produção de novos CAPTCHAS e até mesmo servindo como novas entradas para o reconhecimento de escrita à mão. Ainda é um campo desafiador, pois é muito difícil imitar uma escrita à mão devido a características individuais. A maioria dos trabalhos atuais dessa área apresentam abordagens com técnicas complexas, como redes neurais, as quais necessitam de um grande número de amostras e lidam com longos problemas de otimização. Embora estas técnicas gerem bons resultados, também requerem uma grande quantidade de recursos, os quais na maioria das vezes se tornam não triviais para uso cotidiano. Nesta tese são exploradas novas abordagens para caligrafia computadorizada. Primeiramente, na área de aquisição, é apresentada uma investigação sobre o número de amostras necessárias para reproduzir variabilidade natural. É apresentado que amostras coletadas de um conjunto mínimo são estatisticamente equivalentes em variação quando comparadas a conjuntos maiores. Esta descoberta possui diversos benefícios, tais como tempo menor para coletar as amostras. Além disso, foi utilizado um dispositivo especial que captura a escrita à mão de usuários utilizando papel e caneta comum sem introduzir distorção dos tablets. Na área de síntese é apresentada uma nova técnica para gerar escrita à mão a partir de fontes públicas. Dado um texto de entrada digitalizado, é apresentado um algoritmo que encontra a forma mais similar entre diferentes caracteres utilizando para saída de dados uma grande coleção de fontes disponíveis publicamente. Nossos resultados mostram que, apesar da caligrafia humana ser altamente individual e específica, é possível obter bons resultados com baixo custo computacional, sendo útil para aplicações que não necessitam de alta similaridade.
publishDate 2019
dc.date.issued.fl_str_mv 2019
dc.date.accessioned.fl_str_mv 2020-02-28T04:06:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/206318
dc.identifier.nrb.pt_BR.fl_str_mv 001112149
url http://hdl.handle.net/10183/206318
identifier_str_mv 001112149
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/206318/2/001112149.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/206318/1/001112149.pdf
bitstream.checksum.fl_str_mv 3bac9f78c0a845b38b3fdfeb7462b2c2
22be484fed5da6ec98314e0f1591cc68
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1816737013929345024