Style transfer for text-based image manipulation

Detalhes bibliográficos
Autor(a) principal: Móre, Martin Duarte
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da PUC_RS
Texto Completo: http://tede2.pucrs.br/tede2/handle/tede/8983
Resumo: Grande parte dos dados que produzimos atualmente estão na forma de fotografias digitais, o que aumenta a demanda por aplicações de edição de imagens. Contudo, manipulação de imagens contém uma curva de aprendizado íngreme; desta forma, seria extremamente valioso automatizar ou simplificar este processo artístico para torná-lo mais acessível. Neste estudo, nós investigamos o uso de um subconjunto de linguagem natural (mais específicamente, descrições textuais de objetos) como entrada para automatizar a manipulação de imagens. Nós propomos uma abordagem baseada em aprendizado produnfo para a tarefa de manipulação de imagens baseada em texto que combina treinamento adversário e conceitos de transferência de estilo. Nós avaliamos nosso método, comparamos com abordagens referência e concluímos que nossos resultados possuem qualidade competitiva quando comparados com o estado-da-arte.
id P_RS_1965823ed1b19de8f864731e795e7fe2
oai_identifier_str oai:tede2.pucrs.br:tede/8983
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Barros, Rodrigo Coelhohttp://lattes.cnpq.br/8172124241767828http://lattes.cnpq.br/0481460412007966Móre, Martin Duarte2019-10-28T19:32:14Z2019-03-28http://tede2.pucrs.br/tede2/handle/tede/8983Grande parte dos dados que produzimos atualmente estão na forma de fotografias digitais, o que aumenta a demanda por aplicações de edição de imagens. Contudo, manipulação de imagens contém uma curva de aprendizado íngreme; desta forma, seria extremamente valioso automatizar ou simplificar este processo artístico para torná-lo mais acessível. Neste estudo, nós investigamos o uso de um subconjunto de linguagem natural (mais específicamente, descrições textuais de objetos) como entrada para automatizar a manipulação de imagens. Nós propomos uma abordagem baseada em aprendizado produnfo para a tarefa de manipulação de imagens baseada em texto que combina treinamento adversário e conceitos de transferência de estilo. Nós avaliamos nosso método, comparamos com abordagens referência e concluímos que nossos resultados possuem qualidade competitiva quando comparados com o estado-da-arte.A large amount of the data we produce nowadays is in the form of digital photographs, which increases the demand for photo editing applications. However, image manipulation has a steep learning curve; as such, it would be invaluable to automate or simplify this artistic process to make it more accessible. In this study, we investigate the use of a subset of natural language (more specifically, textual descriptions of objects) as input to automatize image manipulation. We propose a deep learning approach for the task of textbased image manipulation that combines adversarial learning and style transfer concepts. We evaluate our method, compare it to baseline approaches, and conclude that our results have competitive quality when compared to the current state-of-the-art.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2019-10-16T13:51:22Z No. of bitstreams: 1 MARTIN DUARTE MORE_DIS.pdf: 18966494 bytes, checksum: 2eef618ec29e384ce5f00e303a97ba81 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2019-10-28T19:25:51Z (GMT) No. of bitstreams: 1 MARTIN DUARTE MORE_DIS.pdf: 18966494 bytes, checksum: 2eef618ec29e384ce5f00e303a97ba81 (MD5)Made available in DSpace on 2019-10-28T19:32:14Z (GMT). No. of bitstreams: 1 MARTIN DUARTE MORE_DIS.pdf: 18966494 bytes, checksum: 2eef618ec29e384ce5f00e303a97ba81 (MD5) Previous issue date: 2019-03-28application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/177039/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaManipulação de ImagensLinguagem NaturalTransferência de EstiloGANsTreinamento AdversárioImage ManipulationNatural LanguageStyle TransferAdversarial TrainingCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOStyle transfer for text-based image manipulationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgimage/jpeg4986http://tede2.pucrs.br/tede2/bitstream/tede/8983/4/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgb6925ee17ee0ebe737465bc9d7636824MD54TEXTDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txtDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txttext/plain204654http://tede2.pucrs.br/tede2/bitstream/tede/8983/3/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txt34f6f06be91e02a2122f395b12d41c88MD53ORIGINALDIS_MARTIN_DUARTE_MORE_COMPLETO.pdfDIS_MARTIN_DUARTE_MORE_COMPLETO.pdfapplication/pdf2128634http://tede2.pucrs.br/tede2/bitstream/tede/8983/2/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf72c108bf32e12aaac96126356f3f9efdMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590http://tede2.pucrs.br/tede2/bitstream/tede/8983/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/89832019-10-28 21:00:32.671oai:tede2.pucrs.br:tede/8983QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2019-10-28T23:00:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Style transfer for text-based image manipulation
title Style transfer for text-based image manipulation
spellingShingle Style transfer for text-based image manipulation
Móre, Martin Duarte
Manipulação de Imagens
Linguagem Natural
Transferência de Estilo
GANs
Treinamento Adversário
Image Manipulation
Natural Language
Style Transfer
Adversarial Training
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Style transfer for text-based image manipulation
title_full Style transfer for text-based image manipulation
title_fullStr Style transfer for text-based image manipulation
title_full_unstemmed Style transfer for text-based image manipulation
title_sort Style transfer for text-based image manipulation
author Móre, Martin Duarte
author_facet Móre, Martin Duarte
author_role author
dc.contributor.advisor1.fl_str_mv Barros, Rodrigo Coelho
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/8172124241767828
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0481460412007966
dc.contributor.author.fl_str_mv Móre, Martin Duarte
contributor_str_mv Barros, Rodrigo Coelho
dc.subject.por.fl_str_mv Manipulação de Imagens
Linguagem Natural
Transferência de Estilo
GANs
Treinamento Adversário
topic Manipulação de Imagens
Linguagem Natural
Transferência de Estilo
GANs
Treinamento Adversário
Image Manipulation
Natural Language
Style Transfer
Adversarial Training
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Image Manipulation
Natural Language
Style Transfer
Adversarial Training
dc.subject.cnpq.fl_str_mv CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Grande parte dos dados que produzimos atualmente estão na forma de fotografias digitais, o que aumenta a demanda por aplicações de edição de imagens. Contudo, manipulação de imagens contém uma curva de aprendizado íngreme; desta forma, seria extremamente valioso automatizar ou simplificar este processo artístico para torná-lo mais acessível. Neste estudo, nós investigamos o uso de um subconjunto de linguagem natural (mais específicamente, descrições textuais de objetos) como entrada para automatizar a manipulação de imagens. Nós propomos uma abordagem baseada em aprendizado produnfo para a tarefa de manipulação de imagens baseada em texto que combina treinamento adversário e conceitos de transferência de estilo. Nós avaliamos nosso método, comparamos com abordagens referência e concluímos que nossos resultados possuem qualidade competitiva quando comparados com o estado-da-arte.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-10-28T19:32:14Z
dc.date.issued.fl_str_mv 2019-03-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/8983
url http://tede2.pucrs.br/tede2/handle/tede/8983
dc.language.iso.fl_str_mv eng
language eng
dc.relation.program.fl_str_mv -4570527706994352458
dc.relation.confidence.fl_str_mv 500
500
dc.relation.cnpq.fl_str_mv -862078257083325301
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Escola Politécnica
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/8983/4/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/8983/3/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/8983/2/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf
http://tede2.pucrs.br/tede2/bitstream/tede/8983/1/license.txt
bitstream.checksum.fl_str_mv b6925ee17ee0ebe737465bc9d7636824
34f6f06be91e02a2122f395b12d41c88
72c108bf32e12aaac96126356f3f9efd
220e11f2d3ba5354f917c7035aadef24
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765342781702144