Style transfer for text-based image manipulation
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da PUC_RS |
Texto Completo: | http://tede2.pucrs.br/tede2/handle/tede/8983 |
Resumo: | Grande parte dos dados que produzimos atualmente estão na forma de fotografias digitais, o que aumenta a demanda por aplicações de edição de imagens. Contudo, manipulação de imagens contém uma curva de aprendizado íngreme; desta forma, seria extremamente valioso automatizar ou simplificar este processo artístico para torná-lo mais acessível. Neste estudo, nós investigamos o uso de um subconjunto de linguagem natural (mais específicamente, descrições textuais de objetos) como entrada para automatizar a manipulação de imagens. Nós propomos uma abordagem baseada em aprendizado produnfo para a tarefa de manipulação de imagens baseada em texto que combina treinamento adversário e conceitos de transferência de estilo. Nós avaliamos nosso método, comparamos com abordagens referência e concluímos que nossos resultados possuem qualidade competitiva quando comparados com o estado-da-arte. |
id |
P_RS_1965823ed1b19de8f864731e795e7fe2 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/8983 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Barros, Rodrigo Coelhohttp://lattes.cnpq.br/8172124241767828http://lattes.cnpq.br/0481460412007966Móre, Martin Duarte2019-10-28T19:32:14Z2019-03-28http://tede2.pucrs.br/tede2/handle/tede/8983Grande parte dos dados que produzimos atualmente estão na forma de fotografias digitais, o que aumenta a demanda por aplicações de edição de imagens. Contudo, manipulação de imagens contém uma curva de aprendizado íngreme; desta forma, seria extremamente valioso automatizar ou simplificar este processo artístico para torná-lo mais acessível. Neste estudo, nós investigamos o uso de um subconjunto de linguagem natural (mais específicamente, descrições textuais de objetos) como entrada para automatizar a manipulação de imagens. Nós propomos uma abordagem baseada em aprendizado produnfo para a tarefa de manipulação de imagens baseada em texto que combina treinamento adversário e conceitos de transferência de estilo. Nós avaliamos nosso método, comparamos com abordagens referência e concluímos que nossos resultados possuem qualidade competitiva quando comparados com o estado-da-arte.A large amount of the data we produce nowadays is in the form of digital photographs, which increases the demand for photo editing applications. However, image manipulation has a steep learning curve; as such, it would be invaluable to automate or simplify this artistic process to make it more accessible. In this study, we investigate the use of a subset of natural language (more specifically, textual descriptions of objects) as input to automatize image manipulation. We propose a deep learning approach for the task of textbased image manipulation that combines adversarial learning and style transfer concepts. We evaluate our method, compare it to baseline approaches, and conclude that our results have competitive quality when compared to the current state-of-the-art.Submitted by PPG Ciência da Computação (ppgcc@pucrs.br) on 2019-10-16T13:51:22Z No. of bitstreams: 1 MARTIN DUARTE MORE_DIS.pdf: 18966494 bytes, checksum: 2eef618ec29e384ce5f00e303a97ba81 (MD5)Approved for entry into archive by Sheila Dias (sheila.dias@pucrs.br) on 2019-10-28T19:25:51Z (GMT) No. of bitstreams: 1 MARTIN DUARTE MORE_DIS.pdf: 18966494 bytes, checksum: 2eef618ec29e384ce5f00e303a97ba81 (MD5)Made available in DSpace on 2019-10-28T19:32:14Z (GMT). No. of bitstreams: 1 MARTIN DUARTE MORE_DIS.pdf: 18966494 bytes, checksum: 2eef618ec29e384ce5f00e303a97ba81 (MD5) Previous issue date: 2019-03-28application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/177039/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgengPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBrasilEscola PolitécnicaManipulação de ImagensLinguagem NaturalTransferência de EstiloGANsTreinamento AdversárioImage ManipulationNatural LanguageStyle TransferAdversarial TrainingCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOStyle transfer for text-based image manipulationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisTrabalho não apresenta restrição para publicação-4570527706994352458500500-862078257083325301info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAILDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgimage/jpeg4986http://tede2.pucrs.br/tede2/bitstream/tede/8983/4/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpgb6925ee17ee0ebe737465bc9d7636824MD54TEXTDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txtDIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txttext/plain204654http://tede2.pucrs.br/tede2/bitstream/tede/8983/3/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txt34f6f06be91e02a2122f395b12d41c88MD53ORIGINALDIS_MARTIN_DUARTE_MORE_COMPLETO.pdfDIS_MARTIN_DUARTE_MORE_COMPLETO.pdfapplication/pdf2128634http://tede2.pucrs.br/tede2/bitstream/tede/8983/2/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf72c108bf32e12aaac96126356f3f9efdMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8590http://tede2.pucrs.br/tede2/bitstream/tede/8983/1/license.txt220e11f2d3ba5354f917c7035aadef24MD51tede/89832019-10-28 21:00:32.671oai:tede2.pucrs.br:tede/8983QXV0b3JpemE/P28gcGFyYSBQdWJsaWNhPz9vIEVsZXRyP25pY2E6IENvbSBiYXNlIG5vIGRpc3Bvc3RvIG5hIExlaSBGZWRlcmFsIG4/OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYT8/byBlbGV0cj9uaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWY/Y2lhIFVuaXZlcnNpZGFkZSBDYXQ/bGljYSBkbyBSaW8gR3JhbmRlIGRvIFN1bCwgc2VkaWFkYSBhIEF2LiBJcGlyYW5nYSA2NjgxLCBQb3J0byBBbGVncmUsIFJpbyBHcmFuZGUgZG8gU3VsLCBjb20gcmVnaXN0cm8gZGUgQ05QSiA4ODYzMDQxMzAwMDItODEgYmVtIGNvbW8gZW0gb3V0cmFzIGJpYmxpb3RlY2FzIGRpZ2l0YWlzLCBuYWNpb25haXMgZSBpbnRlcm5hY2lvbmFpcywgY29ucz9yY2lvcyBlIHJlZGVzID9zIHF1YWlzIGEgYmlibGlvdGVjYSBkYSBQVUNSUyBwb3NzYSBhIHZpciBwYXJ0aWNpcGFyLCBzZW0gP251cyBhbHVzaXZvIGFvcyBkaXJlaXRvcyBhdXRvcmFpcywgYSB0P3R1bG8gZGUgZGl2dWxnYT8/byBkYSBwcm9kdT8/byBjaWVudD9maWNhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2019-10-28T23:00:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Style transfer for text-based image manipulation |
title |
Style transfer for text-based image manipulation |
spellingShingle |
Style transfer for text-based image manipulation Móre, Martin Duarte Manipulação de Imagens Linguagem Natural Transferência de Estilo GANs Treinamento Adversário Image Manipulation Natural Language Style Transfer Adversarial Training CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
title_short |
Style transfer for text-based image manipulation |
title_full |
Style transfer for text-based image manipulation |
title_fullStr |
Style transfer for text-based image manipulation |
title_full_unstemmed |
Style transfer for text-based image manipulation |
title_sort |
Style transfer for text-based image manipulation |
author |
Móre, Martin Duarte |
author_facet |
Móre, Martin Duarte |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Barros, Rodrigo Coelho |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/8172124241767828 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/0481460412007966 |
dc.contributor.author.fl_str_mv |
Móre, Martin Duarte |
contributor_str_mv |
Barros, Rodrigo Coelho |
dc.subject.por.fl_str_mv |
Manipulação de Imagens Linguagem Natural Transferência de Estilo GANs Treinamento Adversário |
topic |
Manipulação de Imagens Linguagem Natural Transferência de Estilo GANs Treinamento Adversário Image Manipulation Natural Language Style Transfer Adversarial Training CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Image Manipulation Natural Language Style Transfer Adversarial Training |
dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
description |
Grande parte dos dados que produzimos atualmente estão na forma de fotografias digitais, o que aumenta a demanda por aplicações de edição de imagens. Contudo, manipulação de imagens contém uma curva de aprendizado íngreme; desta forma, seria extremamente valioso automatizar ou simplificar este processo artístico para torná-lo mais acessível. Neste estudo, nós investigamos o uso de um subconjunto de linguagem natural (mais específicamente, descrições textuais de objetos) como entrada para automatizar a manipulação de imagens. Nós propomos uma abordagem baseada em aprendizado produnfo para a tarefa de manipulação de imagens baseada em texto que combina treinamento adversário e conceitos de transferência de estilo. Nós avaliamos nosso método, comparamos com abordagens referência e concluímos que nossos resultados possuem qualidade competitiva quando comparados com o estado-da-arte. |
publishDate |
2019 |
dc.date.accessioned.fl_str_mv |
2019-10-28T19:32:14Z |
dc.date.issued.fl_str_mv |
2019-03-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/8983 |
url |
http://tede2.pucrs.br/tede2/handle/tede/8983 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.program.fl_str_mv |
-4570527706994352458 |
dc.relation.confidence.fl_str_mv |
500 500 |
dc.relation.cnpq.fl_str_mv |
-862078257083325301 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Escola Politécnica |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/8983/4/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/8983/3/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/8983/2/DIS_MARTIN_DUARTE_MORE_COMPLETO.pdf http://tede2.pucrs.br/tede2/bitstream/tede/8983/1/license.txt |
bitstream.checksum.fl_str_mv |
b6925ee17ee0ebe737465bc9d7636824 34f6f06be91e02a2122f395b12d41c88 72c108bf32e12aaac96126356f3f9efd 220e11f2d3ba5354f917c7035aadef24 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765342781702144 |