TECo: Automatic Selection and Adaptation of Creative Text in Context

Detalhes bibliográficos
Autor(a) principal: Mendes, Rui Pedro Pereira
Data de Publicação: 2020
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10316/92486
Resumo: Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
id RCAP_e88128c26a4711924bd083515a065f2f
oai_identifier_str oai:estudogeral.uc.pt:10316/92486
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling TECo: Automatic Selection and Adaptation of Creative Text in ContextTECo: Automatic Selection and Adaptation of Creative Text in ContextCriatividade ComputacionalGeração de Linguagem NaturalCriatividade LinguísticaSimilaridade SemânticaProcessamento de Linguagem NaturalComputational CreativityNatural Language GenerationLinguistic CreativitySemantic SimilarityNatural Language ProcessingcDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaDentro da Inteligência Artificial, a área da Criatividade Computacional tem recebido cada vez mais atenção. Dentro desta, a sub-área Criatividade Linguística está na moda, visto que se têm revelado novas soluções para a geração de linguagem, também suportada por avanços recentes na área do Processamento de Linguagem Natural. O trabalho descrito nesta tese situa-se no âmbito das áreas já mencionadas. Desenvolveu um sistema que, dado um texto curto como input, e.g. um título de notícia, é capaz de analisar o seu contexto. Subsequentemente, o sistema tem duas tarefas principais: (i)~seleccionar uma expressão, e.g. um provérbio ou um título de filme, de modo a que seja a mais adequada para o contexto do input} (ii)~gerar uma nova expressão através de métodos de adaptação, de modo a aproximar a expressão ao contexto do input} A maior parte dos sistemas actuais focam-se maioritariamente na língua Inglesa, e o sistema desenvolvido no âmbito desta tese, chamado TECo: Texto Em Contexto, dedica-se inteiramente à língua Portuguesa e, mais especificamente, ao uso de linguagem figurativa.Considerando a primeira tarefa, diversas abordagens foram exploradas, desde métricas mais simples como o coeficiente de Jaccard, até representações mais populares e tradicionais como Word Embeddings, e ainda representações contextuais do estado-da-arte baseadas em Transformers, almejando tirar conclusões em relação à qualidade das expressões seleccionadas.A segunda tarefa requereu uma investigação e desenvolvimento de novas metodologias para adaptar texto baseado no contexto do input. Três novos métodos foram criados, implementados, e testados, de modo a tirar conclusões acerca dos diferentes desafios propostos pela língua Portuguesa.Os resultados obtidos mostram que as expressões geradas tiveram sucesso em termos de se aproximarem do contexto do texto dado, produzindo conteúdo novo e original, ainda que existam melhorias a implementar no futuro, particularmente a nível de humor.Within Artificial Intelligence, the cluster of Computational Creativity has been receiving more attention as of late. In addition, its sub-field of Linguistic Creativity is trending with novel solutions for language generation, also supported by recent advances in Natural Language Processing. The work of this thesis is in the scope of the previous areas. It studies the development of a system that, given a short-text, e.g. a news headline, analyses its context for further utilization. Subsequently, the system aimed to achieve success in two different tasks: (i)~the selection of an expression, e.g. a proverb or a movie title, which is most adequate for the given input's context; (ii)~the generation of an expression, through adaptation methods, in such a way that it is semantically related to the input's context. As most of current systems dedicate their focus mainly to the English language, the system developed in the scope of this thesis, named TECo: Texto Em Contexto (Text in Context), is dedicated entirely to the Portuguese language, and, more specifically, to the usage of figurative language.Considering the first task, several approaches were explored, from simpler metrics such as the Jaccard coefficient, to the popular and traditional Word Embeddings, to state-of-the-art contextual embeddings based on Transformers, aiming to draw conclusions regarding the quality of the selected proverbs. The second challenge required the research and development of new methodologies to adapt text based on a context. Three new methods were designed, implemented and tested, in order to draw conclusions on the different challenges proposed by the Portuguese language.The obtained results show that the generated expressions were successful in terms of approximating to the input's context, producing novel and original content, despite some improvements that should be implemented in future endeavours, particularly concerning humour.2020-07-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/92486http://hdl.handle.net/10316/92486TID:202521230engMendes, Rui Pedro Pereirainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T05:55:24Zoai:estudogeral.uc.pt:10316/92486Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:11:34.218344Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv TECo: Automatic Selection and Adaptation of Creative Text in Context
TECo: Automatic Selection and Adaptation of Creative Text in Context
title TECo: Automatic Selection and Adaptation of Creative Text in Context
spellingShingle TECo: Automatic Selection and Adaptation of Creative Text in Context
Mendes, Rui Pedro Pereira
Criatividade Computacional
Geração de Linguagem Natural
Criatividade Linguística
Similaridade Semântica
Processamento de Linguagem Natural
Computational Creativity
Natural Language Generation
Linguistic Creativity
Semantic Similarity
Natural Language Processingc
title_short TECo: Automatic Selection and Adaptation of Creative Text in Context
title_full TECo: Automatic Selection and Adaptation of Creative Text in Context
title_fullStr TECo: Automatic Selection and Adaptation of Creative Text in Context
title_full_unstemmed TECo: Automatic Selection and Adaptation of Creative Text in Context
title_sort TECo: Automatic Selection and Adaptation of Creative Text in Context
author Mendes, Rui Pedro Pereira
author_facet Mendes, Rui Pedro Pereira
author_role author
dc.contributor.author.fl_str_mv Mendes, Rui Pedro Pereira
dc.subject.por.fl_str_mv Criatividade Computacional
Geração de Linguagem Natural
Criatividade Linguística
Similaridade Semântica
Processamento de Linguagem Natural
Computational Creativity
Natural Language Generation
Linguistic Creativity
Semantic Similarity
Natural Language Processingc
topic Criatividade Computacional
Geração de Linguagem Natural
Criatividade Linguística
Similaridade Semântica
Processamento de Linguagem Natural
Computational Creativity
Natural Language Generation
Linguistic Creativity
Semantic Similarity
Natural Language Processingc
description Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia
publishDate 2020
dc.date.none.fl_str_mv 2020-07-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10316/92486
http://hdl.handle.net/10316/92486
TID:202521230
url http://hdl.handle.net/10316/92486
identifier_str_mv TID:202521230
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799134012550152192