Modeling of Synthetic Players As An Instrument For Testing Generative Content
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10316/96018 |
Resumo: | Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
id |
RCAP_ef5b147bb77e2ebbc3df5c1e3596db54 |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/96018 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Modeling of Synthetic Players As An Instrument For Testing Generative ContentModelação de Jogadores Sintéticos como Instrumento para Ensaio de Conteúdos GenerativosInteligência Artificial em JogosJogador SintéticoAprendizagem por ImitaçãoAprendizagem por ReforçoPlaneamentoArtificial Intelligence in GamesSynthetic PlayerImitation LearningReinforcement LearningPlanningDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e TecnologiaHá uma necessidade de se encontrar novos métodos confiáveis para testar cenários de jogo gerados procedimentalmente. Um método que mostra potencial é teste automatizado, que consiste em usar jogador sintéticos para testar novos cenários de jogo. Deste modo, para testar esta suposição, este trabalho modela dois tipos de jogadores sintéticos que são colocados num cenário semelhante ao Bomberman. Neste caso de estudo, os jogadores têm de colocar bombas em lugares estratégicos para eliminar os adversários. Um jogador sintético é desenvolvido através de uma abordagem baseada em planeamento, em que o agente procura por uma sequência de ações que leva desde o estado atual do jogo até ao estado desejado. A segunda abordagem é aprendizagem computacional, mais precisamente combinar aprendizagem por imitação com aprendizagem por reforço, para que primeiro, o jogador sintético aprenda observando demonstrações humanas, e depois melhore a sua performance através das recompensas do ambiente. Resultados mostram que o jogador sintético de planeamento consegue jogar e ganhar o jogo consistentemente contra oponentes desenvolvidos pela abordagem de aprendizagem computacional, e consegue generalizar bem para novos cenários. Também obteve resultados positivos num inquérito acerca da sua credibilidade. Estes atributos fazem do jogador sintético de planeamento uma ferramente viável para testar cenários de jogo gerados procedimentalmente. Contudo, o agente de planeamento tem dificuldades quando joga contra um jogador humano, fornecendo apenas um desafio de dificuldade fácil a moderada para o humano. A abordagem de aprendizagem computacional produziu resultados modestos, não sendo capaz de vencer o jogo consistentemente. O seu desempenho pouco satisfatório também magoa a sua credibilidade. Não obstante esse facto, um modelo treinado aparenta ter aprendido as regras básicas do jogo e conseguiu sobreviver períodos de tempo suficientes para explorar o espaço de jogo.There is a need to discover new, reliable techniques to test procedurally generated game scenarios. One method that has potential is automated testing, which consists in using synthetic players to play and test the newly generated scenarios. Therefore, to test this assumption, this work models two types of synthetic players that are put in a Bomberman-like scenario. In this case study, the players must place bombs in strategic places in order to eliminate the opponents. One synthetic player is developed via a planning-based approach, in which the agent searches for a sequence of actions that leads from the current state of the game to the desired game state. The second approach is machine learning, more precisely, combining Imitation Learning with Reinforcement Learning in order for the synthetic player to first learn by observing human demonstrations, and then improve its performance by maximizing its policy via the environment rewards. Results show that the planning synthetic player manages to play and win the game consistently against opponents developed by the machine learning approach, and can generalize well to new unseen scenarios. It also obtained positive scores in a survey regarding its believability. All of these attributes makes the planning synthetic player a viable tool to test procedurally generated game scenarios. However, the planning agent struggles when facing a human player, providing an easy-to-moderate challenge for the human. The machine learning approach produced modest results, not being able to win the game consistently. Its modest performance harms its believability as well. Nonetheless, a particular trained model could be perceived as if grasping how to play the game and managed to survive long-enough periods to explore the game space.2021-07-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10316/96018http://hdl.handle.net/10316/96018TID:202778134engAlves, Diogo Rafael Cordeiroinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2022-05-25T03:55:44Zoai:estudogeral.uc.pt:10316/96018Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T21:14:23.036699Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Modeling of Synthetic Players As An Instrument For Testing Generative Content Modelação de Jogadores Sintéticos como Instrumento para Ensaio de Conteúdos Generativos |
title |
Modeling of Synthetic Players As An Instrument For Testing Generative Content |
spellingShingle |
Modeling of Synthetic Players As An Instrument For Testing Generative Content Alves, Diogo Rafael Cordeiro Inteligência Artificial em Jogos Jogador Sintético Aprendizagem por Imitação Aprendizagem por Reforço Planeamento Artificial Intelligence in Games Synthetic Player Imitation Learning Reinforcement Learning Planning |
title_short |
Modeling of Synthetic Players As An Instrument For Testing Generative Content |
title_full |
Modeling of Synthetic Players As An Instrument For Testing Generative Content |
title_fullStr |
Modeling of Synthetic Players As An Instrument For Testing Generative Content |
title_full_unstemmed |
Modeling of Synthetic Players As An Instrument For Testing Generative Content |
title_sort |
Modeling of Synthetic Players As An Instrument For Testing Generative Content |
author |
Alves, Diogo Rafael Cordeiro |
author_facet |
Alves, Diogo Rafael Cordeiro |
author_role |
author |
dc.contributor.author.fl_str_mv |
Alves, Diogo Rafael Cordeiro |
dc.subject.por.fl_str_mv |
Inteligência Artificial em Jogos Jogador Sintético Aprendizagem por Imitação Aprendizagem por Reforço Planeamento Artificial Intelligence in Games Synthetic Player Imitation Learning Reinforcement Learning Planning |
topic |
Inteligência Artificial em Jogos Jogador Sintético Aprendizagem por Imitação Aprendizagem por Reforço Planeamento Artificial Intelligence in Games Synthetic Player Imitation Learning Reinforcement Learning Planning |
description |
Dissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021-07-14 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10316/96018 http://hdl.handle.net/10316/96018 TID:202778134 |
url |
http://hdl.handle.net/10316/96018 |
identifier_str_mv |
TID:202778134 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799134041311543296 |