Análise de aprendizado adversarial baseado em similaridade na geração de texto

Detalhes bibliográficos
Autor(a) principal: Rosa, Gustavo Henrique de
Data de Publicação: 2022
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: http://hdl.handle.net/11449/238053
Resumo: Algoritmos de Aprendizado de Máquina têm sido amplamente fomentados nos últimos anos, principalmente devido às suas capacidades discriminativas em problemas de Visão Computacional e Processamento de Linguagem Natural. Ademais, suas capacidades generativas permitiram aplicações em tarefas de natureza discreta (sequências de caracteres e palavras), isto é, geração de texto. Uma arquitetura em específico, denotada por Redes Adversariais Generativas, utiliza uma estrutura composta por discriminador e gerador, os quais procuram obter um equilíbrio entre gerar dados artificiais e classificá-los como dados verdadeiros. Recentemente, vários trabalhos propuseram soluções baseadas em Redes Adversariais Generativas para a geração de texto, porém apenas alguns deles conseguiram gerar textos sem palavras repetidas e com algum significado semântico. Um problema decorrente das Redes Adversariais Generativas consiste na dificuldade em estabelecer um equilíbrio no treinamento e, consequentemente, gerar textos artificiais que assemelham-se aos textos reais. Desta forma, a presente tese aprimora o desenvolvimento de modelos adversariais textuais através de funções de similaridade aprendidas por Redes Siamesas, as quais fornecem recompensas capazes de melhor distinguir entre textos artificiais e reais. Adicionalmente, tais modelos são aperfeiçoados com o uso da otimização meta-heurística, a qual fornece conjuntos de hiperparâmetros específicos para as tarefas em questão. Os resultados experimentais obtidos demonstram a capacidade da arquitetura proposta, denotada por Rede Adversarial Generativa por Similaridade Textual, do inglês Text-Similarity Generative Adversarial Network (TS-GAN), em quatro base de dados da literatura. As TS-GANs atingiram resultados superiores às arquiteturas adversariais estado-da-arte e, em suas versões pós-otimização, foram capazes de aprimorar as métricas de suas versões iniciais (sem otimização) em duas de quatro bases de dados.
id UNSP_beb11ee935af34022c1d29be0fd209c2
oai_identifier_str oai:repositorio.unesp.br:11449/238053
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Análise de aprendizado adversarial baseado em similaridade na geração de textoText generation analysis using similarity-based adversarial learningAprendizado de máquinaAprendizado adversarialProcessamento de linguagem naturalGeração de textoRedes siamesasOtimização meta-heurísticaMachine learningAdversarial learningNatural language processingText generationSiamese networksMeta-heuristic optimizationAlgoritmos de Aprendizado de Máquina têm sido amplamente fomentados nos últimos anos, principalmente devido às suas capacidades discriminativas em problemas de Visão Computacional e Processamento de Linguagem Natural. Ademais, suas capacidades generativas permitiram aplicações em tarefas de natureza discreta (sequências de caracteres e palavras), isto é, geração de texto. Uma arquitetura em específico, denotada por Redes Adversariais Generativas, utiliza uma estrutura composta por discriminador e gerador, os quais procuram obter um equilíbrio entre gerar dados artificiais e classificá-los como dados verdadeiros. Recentemente, vários trabalhos propuseram soluções baseadas em Redes Adversariais Generativas para a geração de texto, porém apenas alguns deles conseguiram gerar textos sem palavras repetidas e com algum significado semântico. Um problema decorrente das Redes Adversariais Generativas consiste na dificuldade em estabelecer um equilíbrio no treinamento e, consequentemente, gerar textos artificiais que assemelham-se aos textos reais. Desta forma, a presente tese aprimora o desenvolvimento de modelos adversariais textuais através de funções de similaridade aprendidas por Redes Siamesas, as quais fornecem recompensas capazes de melhor distinguir entre textos artificiais e reais. Adicionalmente, tais modelos são aperfeiçoados com o uso da otimização meta-heurística, a qual fornece conjuntos de hiperparâmetros específicos para as tarefas em questão. Os resultados experimentais obtidos demonstram a capacidade da arquitetura proposta, denotada por Rede Adversarial Generativa por Similaridade Textual, do inglês Text-Similarity Generative Adversarial Network (TS-GAN), em quatro base de dados da literatura. As TS-GANs atingiram resultados superiores às arquiteturas adversariais estado-da-arte e, em suas versões pós-otimização, foram capazes de aprimorar as métricas de suas versões iniciais (sem otimização) em duas de quatro bases de dados.Machine Learning algorithms have been paramount in the latest years, mainly due to their discriminative capacity in Computer Vision and Natural Language Processing tasks. Furthermore, their generative potentials allowed usage in discrete-based (sequences of characters and words) tasks, such as text generation. A specific architecture denoted as Generative Adversarial Networks uses an structure composed of discriminators and generators to establish an equilibrium between artificial data generation and their classification as real data. Several works proposed adversarial-based models to generate text; however, only a few could generate non-repeated text with little semantic significance. Furthermore, a recurring issue regarding Generative Adversarial Networks consists of the difficulty of establishing a training equilibrium and, consequently, generating artificial text that resembles the original ones. Therefore, this thesis enhances the development of text-based adversarial models through similarity functions learned from Siamese Networks, which provides rewards capable of better distinguishing between artificial and original texts. Such models are improved through meta-heuristic optimization, which furnishes specific hyperparameters to the accounted tasks. The experimental results indicate the capacity of the proposed architecture, denoted by Text-Similarity Generative Adversarial Network (TS-GAN), amongst four literature datasets. The TS-GANs obtained state-of-the-art results and, in their post-optimization versions, were able to improve their standard versions (without optimization) in two out of four datasets.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)FAPESP: 2019/02205-5Universidade Estadual Paulista (Unesp)Papa, João Paulo [UNESP]Universidade Estadual Paulista (Unesp)Rosa, Gustavo Henrique de2022-12-06T16:38:14Z2022-12-06T16:38:14Z2022-11-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://hdl.handle.net/11449/23805333004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-04-23T14:56:24Zoai:repositorio.unesp.br:11449/238053Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-08-05T20:09:38.179433Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Análise de aprendizado adversarial baseado em similaridade na geração de texto
Text generation analysis using similarity-based adversarial learning
title Análise de aprendizado adversarial baseado em similaridade na geração de texto
spellingShingle Análise de aprendizado adversarial baseado em similaridade na geração de texto
Rosa, Gustavo Henrique de
Aprendizado de máquina
Aprendizado adversarial
Processamento de linguagem natural
Geração de texto
Redes siamesas
Otimização meta-heurística
Machine learning
Adversarial learning
Natural language processing
Text generation
Siamese networks
Meta-heuristic optimization
title_short Análise de aprendizado adversarial baseado em similaridade na geração de texto
title_full Análise de aprendizado adversarial baseado em similaridade na geração de texto
title_fullStr Análise de aprendizado adversarial baseado em similaridade na geração de texto
title_full_unstemmed Análise de aprendizado adversarial baseado em similaridade na geração de texto
title_sort Análise de aprendizado adversarial baseado em similaridade na geração de texto
author Rosa, Gustavo Henrique de
author_facet Rosa, Gustavo Henrique de
author_role author
dc.contributor.none.fl_str_mv Papa, João Paulo [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Rosa, Gustavo Henrique de
dc.subject.por.fl_str_mv Aprendizado de máquina
Aprendizado adversarial
Processamento de linguagem natural
Geração de texto
Redes siamesas
Otimização meta-heurística
Machine learning
Adversarial learning
Natural language processing
Text generation
Siamese networks
Meta-heuristic optimization
topic Aprendizado de máquina
Aprendizado adversarial
Processamento de linguagem natural
Geração de texto
Redes siamesas
Otimização meta-heurística
Machine learning
Adversarial learning
Natural language processing
Text generation
Siamese networks
Meta-heuristic optimization
description Algoritmos de Aprendizado de Máquina têm sido amplamente fomentados nos últimos anos, principalmente devido às suas capacidades discriminativas em problemas de Visão Computacional e Processamento de Linguagem Natural. Ademais, suas capacidades generativas permitiram aplicações em tarefas de natureza discreta (sequências de caracteres e palavras), isto é, geração de texto. Uma arquitetura em específico, denotada por Redes Adversariais Generativas, utiliza uma estrutura composta por discriminador e gerador, os quais procuram obter um equilíbrio entre gerar dados artificiais e classificá-los como dados verdadeiros. Recentemente, vários trabalhos propuseram soluções baseadas em Redes Adversariais Generativas para a geração de texto, porém apenas alguns deles conseguiram gerar textos sem palavras repetidas e com algum significado semântico. Um problema decorrente das Redes Adversariais Generativas consiste na dificuldade em estabelecer um equilíbrio no treinamento e, consequentemente, gerar textos artificiais que assemelham-se aos textos reais. Desta forma, a presente tese aprimora o desenvolvimento de modelos adversariais textuais através de funções de similaridade aprendidas por Redes Siamesas, as quais fornecem recompensas capazes de melhor distinguir entre textos artificiais e reais. Adicionalmente, tais modelos são aperfeiçoados com o uso da otimização meta-heurística, a qual fornece conjuntos de hiperparâmetros específicos para as tarefas em questão. Os resultados experimentais obtidos demonstram a capacidade da arquitetura proposta, denotada por Rede Adversarial Generativa por Similaridade Textual, do inglês Text-Similarity Generative Adversarial Network (TS-GAN), em quatro base de dados da literatura. As TS-GANs atingiram resultados superiores às arquiteturas adversariais estado-da-arte e, em suas versões pós-otimização, foram capazes de aprimorar as métricas de suas versões iniciais (sem otimização) em duas de quatro bases de dados.
publishDate 2022
dc.date.none.fl_str_mv 2022-12-06T16:38:14Z
2022-12-06T16:38:14Z
2022-11-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/238053
33004153073P2
url http://hdl.handle.net/11449/238053
identifier_str_mv 33004153073P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1808129166550237184