Efficient acquisition and synthesis in computerized handwriting
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/206318 |
Resumo: | Apesar de hoje em dia ser comum trabalhar durante quase todo tempo com textos escritos digitalmente, escrever textos à mão possui um status especial em casos específicos. Ainda é comum que pessoas aprendam a escrever à mão desde pequenas, inclusive sendo uma das formas mais conhecidas de identificação pessoal ao longo da vida. A área de escrita à mão computadorizada provê soluções nos seus três campos principais: aquisição, reconhecimento e síntese. Em particular, a área de síntese de caligrafia é responsável por gerar textos utilizando modelos matemáticos de forma que pareçam ter sido feitos por alguém à mão. Esta área possui diversos usos, sendo eles artísticos, na produção de novos CAPTCHAS e até mesmo servindo como novas entradas para o reconhecimento de escrita à mão. Ainda é um campo desafiador, pois é muito difícil imitar uma escrita à mão devido a características individuais. A maioria dos trabalhos atuais dessa área apresentam abordagens com técnicas complexas, como redes neurais, as quais necessitam de um grande número de amostras e lidam com longos problemas de otimização. Embora estas técnicas gerem bons resultados, também requerem uma grande quantidade de recursos, os quais na maioria das vezes se tornam não triviais para uso cotidiano. Nesta tese são exploradas novas abordagens para caligrafia computadorizada. Primeiramente, na área de aquisição, é apresentada uma investigação sobre o número de amostras necessárias para reproduzir variabilidade natural. É apresentado que amostras coletadas de um conjunto mínimo são estatisticamente equivalentes em variação quando comparadas a conjuntos maiores. Esta descoberta possui diversos benefícios, tais como tempo menor para coletar as amostras. Além disso, foi utilizado um dispositivo especial que captura a escrita à mão de usuários utilizando papel e caneta comum sem introduzir distorção dos tablets. Na área de síntese é apresentada uma nova técnica para gerar escrita à mão a partir de fontes públicas. Dado um texto de entrada digitalizado, é apresentado um algoritmo que encontra a forma mais similar entre diferentes caracteres utilizando para saída de dados uma grande coleção de fontes disponíveis publicamente. Nossos resultados mostram que, apesar da caligrafia humana ser altamente individual e específica, é possível obter bons resultados com baixo custo computacional, sendo útil para aplicações que não necessitam de alta similaridade. |
id |
URGS_6fa8b434f89e9360f218b100c495f7a4 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/206318 |
network_acronym_str |
URGS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
repository_id_str |
1853 |
spelling |
Balreira, Dennis GiovaniWalter, Marcelo2020-02-28T04:06:53Z2019http://hdl.handle.net/10183/206318001112149Apesar de hoje em dia ser comum trabalhar durante quase todo tempo com textos escritos digitalmente, escrever textos à mão possui um status especial em casos específicos. Ainda é comum que pessoas aprendam a escrever à mão desde pequenas, inclusive sendo uma das formas mais conhecidas de identificação pessoal ao longo da vida. A área de escrita à mão computadorizada provê soluções nos seus três campos principais: aquisição, reconhecimento e síntese. Em particular, a área de síntese de caligrafia é responsável por gerar textos utilizando modelos matemáticos de forma que pareçam ter sido feitos por alguém à mão. Esta área possui diversos usos, sendo eles artísticos, na produção de novos CAPTCHAS e até mesmo servindo como novas entradas para o reconhecimento de escrita à mão. Ainda é um campo desafiador, pois é muito difícil imitar uma escrita à mão devido a características individuais. A maioria dos trabalhos atuais dessa área apresentam abordagens com técnicas complexas, como redes neurais, as quais necessitam de um grande número de amostras e lidam com longos problemas de otimização. Embora estas técnicas gerem bons resultados, também requerem uma grande quantidade de recursos, os quais na maioria das vezes se tornam não triviais para uso cotidiano. Nesta tese são exploradas novas abordagens para caligrafia computadorizada. Primeiramente, na área de aquisição, é apresentada uma investigação sobre o número de amostras necessárias para reproduzir variabilidade natural. É apresentado que amostras coletadas de um conjunto mínimo são estatisticamente equivalentes em variação quando comparadas a conjuntos maiores. Esta descoberta possui diversos benefícios, tais como tempo menor para coletar as amostras. Além disso, foi utilizado um dispositivo especial que captura a escrita à mão de usuários utilizando papel e caneta comum sem introduzir distorção dos tablets. Na área de síntese é apresentada uma nova técnica para gerar escrita à mão a partir de fontes públicas. Dado um texto de entrada digitalizado, é apresentado um algoritmo que encontra a forma mais similar entre diferentes caracteres utilizando para saída de dados uma grande coleção de fontes disponíveis publicamente. Nossos resultados mostram que, apesar da caligrafia humana ser altamente individual e específica, é possível obter bons resultados com baixo custo computacional, sendo útil para aplicações que não necessitam de alta similaridade.Although nowadays people rely almost full time on digital text, the use of handwriting has earned a special status for specific cases. We still learn to write by hand and use it as an identifying tool throughout our entire life. The computerized handwriting area addresses solutions in the three main handwritten fields: acquisition, recognition, and synthesis. In particular, handwriting synthesis generates renderings of text which resemble natural handwriting but are, in fact, synthesized by a model. The results in this area have several uses, such as artistic applications, CAPTCHA generation, and by providing new examples for handwriting recognition. It is still a challenging research area since it is challenging to mimic natural handwriting due to individual characteristics. Most of the current research in the field present robust approaches with sophisticated techniques, such as neural networks, which require a large number of samples and deal with large time-consuming optimization problems. Although they produce natural-looking results overall, these techniques require a large number of resources, which most of the time make them non-trivial for daily usage. In this thesis, we introduce two main contributions to computerized handwriting. First, in the acquisition field, we present an in-depth look investigating the number of samples needed for reproducing natural variability. We show that writing samples collected from a minimal set are statistically equivalent in variation with larger sets. This discovery provides many benefits, such as the shorter time needed to collect the samples. Our samples were collected from a special tablet device that captures the users handwriting using pen and paper, without introducing typical distortion produced by graphics tablets. Second, in the synthesis area, we introduce a novel technique to generate handwriting from public fonts. Given a digitalized input sample of the desired handwriting, we present an algorithm that finds the best match between characters using as a source for the output text the extensive collection of publicly available fonts designed to look like handwriting. Our results show that even though human calligraphy is highly individual and specialized, visually similar renderings are possible for many applications that do not demand full similarity, considerably increasing its synthesis variability from a few inputs without the complexity of state-of-the-art approaches.application/pdfengComputação gráficaProcessamento de imagensCaligrafiaComputer graphicsimage processinghandwriting synthesishandwriting acquisitioncharacter comparisonEfficient acquisition and synthesis in computerized handwritingAquisição e síntese eficientes em caligrafia computadorizada info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2019doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001112149.pdf.txt001112149.pdf.txtExtracted Texttext/plain164319http://www.lume.ufrgs.br/bitstream/10183/206318/2/001112149.pdf.txt3bac9f78c0a845b38b3fdfeb7462b2c2MD52ORIGINAL001112149.pdfTexto completo (inglês)application/pdf14363134http://www.lume.ufrgs.br/bitstream/10183/206318/1/001112149.pdf22be484fed5da6ec98314e0f1591cc68MD5110183/2063182021-05-26 04:41:59.494879oai:www.lume.ufrgs.br:10183/206318Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532021-05-26T07:41:59Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Efficient acquisition and synthesis in computerized handwriting |
dc.title.alternative.pt.fl_str_mv |
Aquisição e síntese eficientes em caligrafia computadorizada |
title |
Efficient acquisition and synthesis in computerized handwriting |
spellingShingle |
Efficient acquisition and synthesis in computerized handwriting Balreira, Dennis Giovani Computação gráfica Processamento de imagens Caligrafia Computer graphics image processing handwriting synthesis handwriting acquisition character comparison |
title_short |
Efficient acquisition and synthesis in computerized handwriting |
title_full |
Efficient acquisition and synthesis in computerized handwriting |
title_fullStr |
Efficient acquisition and synthesis in computerized handwriting |
title_full_unstemmed |
Efficient acquisition and synthesis in computerized handwriting |
title_sort |
Efficient acquisition and synthesis in computerized handwriting |
author |
Balreira, Dennis Giovani |
author_facet |
Balreira, Dennis Giovani |
author_role |
author |
dc.contributor.author.fl_str_mv |
Balreira, Dennis Giovani |
dc.contributor.advisor1.fl_str_mv |
Walter, Marcelo |
contributor_str_mv |
Walter, Marcelo |
dc.subject.por.fl_str_mv |
Computação gráfica Processamento de imagens Caligrafia |
topic |
Computação gráfica Processamento de imagens Caligrafia Computer graphics image processing handwriting synthesis handwriting acquisition character comparison |
dc.subject.eng.fl_str_mv |
Computer graphics image processing handwriting synthesis handwriting acquisition character comparison |
description |
Apesar de hoje em dia ser comum trabalhar durante quase todo tempo com textos escritos digitalmente, escrever textos à mão possui um status especial em casos específicos. Ainda é comum que pessoas aprendam a escrever à mão desde pequenas, inclusive sendo uma das formas mais conhecidas de identificação pessoal ao longo da vida. A área de escrita à mão computadorizada provê soluções nos seus três campos principais: aquisição, reconhecimento e síntese. Em particular, a área de síntese de caligrafia é responsável por gerar textos utilizando modelos matemáticos de forma que pareçam ter sido feitos por alguém à mão. Esta área possui diversos usos, sendo eles artísticos, na produção de novos CAPTCHAS e até mesmo servindo como novas entradas para o reconhecimento de escrita à mão. Ainda é um campo desafiador, pois é muito difícil imitar uma escrita à mão devido a características individuais. A maioria dos trabalhos atuais dessa área apresentam abordagens com técnicas complexas, como redes neurais, as quais necessitam de um grande número de amostras e lidam com longos problemas de otimização. Embora estas técnicas gerem bons resultados, também requerem uma grande quantidade de recursos, os quais na maioria das vezes se tornam não triviais para uso cotidiano. Nesta tese são exploradas novas abordagens para caligrafia computadorizada. Primeiramente, na área de aquisição, é apresentada uma investigação sobre o número de amostras necessárias para reproduzir variabilidade natural. É apresentado que amostras coletadas de um conjunto mínimo são estatisticamente equivalentes em variação quando comparadas a conjuntos maiores. Esta descoberta possui diversos benefícios, tais como tempo menor para coletar as amostras. Além disso, foi utilizado um dispositivo especial que captura a escrita à mão de usuários utilizando papel e caneta comum sem introduzir distorção dos tablets. Na área de síntese é apresentada uma nova técnica para gerar escrita à mão a partir de fontes públicas. Dado um texto de entrada digitalizado, é apresentado um algoritmo que encontra a forma mais similar entre diferentes caracteres utilizando para saída de dados uma grande coleção de fontes disponíveis publicamente. Nossos resultados mostram que, apesar da caligrafia humana ser altamente individual e específica, é possível obter bons resultados com baixo custo computacional, sendo útil para aplicações que não necessitam de alta similaridade. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019 |
dc.date.accessioned.fl_str_mv |
2020-02-28T04:06:53Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/206318 |
dc.identifier.nrb.pt_BR.fl_str_mv |
001112149 |
url |
http://hdl.handle.net/10183/206318 |
identifier_str_mv |
001112149 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/206318/2/001112149.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/206318/1/001112149.pdf |
bitstream.checksum.fl_str_mv |
3bac9f78c0a845b38b3fdfeb7462b2c2 22be484fed5da6ec98314e0f1591cc68 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
_version_ |
1816737013929345024 |