TECo: Automatic Selection and Adaptation of Creative Text in Context
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/92486 |
Resumo: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_e88128c26a4711924bd083515a065f2f |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/92486 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
TECo: Automatic Selection and Adaptation of Creative Text in ContextTECo: Automatic Selection and Adaptation of Creative Text in ContextCriatividade ComputacionalGeração de Linguagem NaturalCriatividade LinguísticaSimilaridade SemânticaProcessamento de Linguagem NaturalComputational CreativityNatural Language GenerationLinguistic CreativitySemantic SimilarityNatural Language ProcessingcDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaDentro da Inteligência Artificial, a área da Criatividade Computacional tem recebido cada vez mais atenção. Dentro desta, a sub-área Criatividade Linguística está na moda, visto que se têm revelado novas soluções para a geração de linguagem, também suportada por avanços recentes na área do Processamento de Linguagem Natural. O trabalho descrito nesta tese situa-se no âmbito das áreas já mencionadas. Desenvolveu um sistema que, dado um texto curto como input, e.g. um título de notícia, é capaz de analisar o seu contexto. Subsequentemente, o sistema tem duas tarefas principais: (i)~seleccionar uma expressão, e.g. um provérbio ou um título de filme, de modo a que seja a mais adequada para o contexto do input} (ii)~gerar uma nova expressão através de métodos de adaptação, de modo a aproximar a expressão ao contexto do input} A maior parte dos sistemas actuais focam-se maioritariamente na língua Inglesa, e o sistema desenvolvido no âmbito desta tese, chamado TECo: Texto Em Contexto, dedica-se inteiramente à língua Portuguesa e, mais especificamente, ao uso de linguagem figurativa.Considerando a primeira tarefa, diversas abordagens foram exploradas, desde métricas mais simples como o coeficiente de Jaccard, até representações mais populares e tradicionais como Word Embeddings, e ainda representações contextuais do estado-da-arte baseadas em Transformers, almejando tirar conclusões em relação à qualidade das expressões seleccionadas.A segunda tarefa requereu uma investigação e desenvolvimento de novas metodologias para adaptar texto baseado no contexto do input. Três novos métodos foram criados, implementados, e testados, de modo a tirar conclusões acerca dos diferentes desafios propostos pela língua Portuguesa.Os resultados obtidos mostram que as expressões geradas tiveram sucesso em termos de se aproximarem do contexto do texto dado, produzindo conteúdo novo e original, ainda que existam melhorias a implementar no futuro, particularmente a nível de humor.Within Artificial Intelligence, the cluster of Computational Creativity has been receiving more attention as of late. In addition, its sub-field of Linguistic Creativity is trending with novel solutions for language generation, also supported by recent advances in Natural Language Processing. The work of this thesis is in the scope of the previous areas. It studies the development of a system that, given a short-text, e.g. a news headline, analyses its context for further utilization. Subsequently, the system aimed to achieve success in two different tasks: (i)~the selection of an expression, e.g. a proverb or a movie title, which is most adequate for the given input's context; (ii)~the generation of an expression, through adaptation methods, in such a way that it is semantically related to the input's context. As most of current systems dedicate their focus mainly to the English language, the system developed in the scope of this thesis, named TECo: Texto Em Contexto (Text in Context), is dedicated entirely to the Portuguese language, and, more specifically, to the usage of figurative language.Considering the first task, several approaches were explored, from simpler metrics such as the Jaccard coefficient, to the popular and traditional Word Embeddings, to state-of-the-art contextual embeddings based on Transformers, aiming to draw conclusions regarding the quality of the selected proverbs. The second challenge required the research and development of new methodologies to adapt text based on a context. Three new methods were designed, implemented and tested, in order to draw conclusions on the different challenges proposed by the Portuguese language.The obtained results show that the generated expressions were successful in terms of approximating to the input's context, producing novel and original content, despite some improvements that should be implemented in future endeavours, particularly concerning humour.2020-07-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/92486http://hdl.handle.net/10316/92486TID:202521230engMendes, Rui Pedro Pereirainfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T05:55:24Zoai:estudogeral.uc.pt:10316/92486Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:11:34.218344Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
TECo: Automatic Selection and Adaptation of Creative Text in Context TECo: Automatic Selection and Adaptation of Creative Text in Context |
title |
TECo: Automatic Selection and Adaptation of Creative Text in Context |
spellingShingle |
TECo: Automatic Selection and Adaptation of Creative Text in Context Mendes, Rui Pedro Pereira Criatividade Computacional Geração de Linguagem Natural Criatividade Linguística Similaridade Semântica Processamento de Linguagem Natural Computational Creativity Natural Language Generation Linguistic Creativity Semantic Similarity Natural Language Processingc |
title_short |
TECo: Automatic Selection and Adaptation of Creative Text in Context |
title_full |
TECo: Automatic Selection and Adaptation of Creative Text in Context |
title_fullStr |
TECo: Automatic Selection and Adaptation of Creative Text in Context |
title_full_unstemmed |
TECo: Automatic Selection and Adaptation of Creative Text in Context |
title_sort |
TECo: Automatic Selection and Adaptation of Creative Text in Context |
author |
Mendes, Rui Pedro Pereira |
author_facet |
Mendes, Rui Pedro Pereira |
author_role |
author |
dc.contributor.author.fl_str_mv |
Mendes, Rui Pedro Pereira |
dc.subject.por.fl_str_mv |
Criatividade Computacional Geração de Linguagem Natural Criatividade Linguística Similaridade Semântica Processamento de Linguagem Natural Computational Creativity Natural Language Generation Linguistic Creativity Semantic Similarity Natural Language Processingc |
topic |
Criatividade Computacional Geração de Linguagem Natural Criatividade Linguística Similaridade Semântica Processamento de Linguagem Natural Computational Creativity Natural Language Generation Linguistic Creativity Semantic Similarity Natural Language Processingc |
description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-07-23 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/92486 http://hdl.handle.net/10316/92486 TID:202521230 |
url |
http://hdl.handle.net/10316/92486 |
identifier_str_mv |
TID:202521230 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134012550152192 |