Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Trabalho de conclusão de curso |
Idioma: | por |
Título da fonte: | Repositório Institucional da UNIPAMPA |
Texto Completo: | http://dspace.unipampa.edu.br:8080/jspui/handle/riu/4787 |
Resumo: | Dentre as áreas abordadas na Computação, a evolução da Inteligência Artificial vem se destacando, em especial na área de jogos. O objetivo deste trabalho é o desenvolvimento de um agente inteligente capaz de jogar múltiplos jogos. Para isto, primeiramente foi realizado um estudo sobre os conceitos necessários, os quais constituem toda a fundamentação teórica deste trabalho. Visando a abstração de conceitos de aprendizado de máquina e processamento de imagens, foram utilizadas as bibliotecas Keras e Gym. São apresentados modelos de Inteligência Artificial, Aprendizado de Máquina, Aprendizagem Profunda, Aprendizagem por Reforço, Aprendizagem por Reforço Profundo, Aprendizagem Q e Ator Crítico de Vantagem Assíncrono, adaptados para o contexto deste trabalho. Este trabalho realizou o levantamento do estado da arte na área de algoritmos para jogar jogos genéricos, apresentando os trabalhos que possuem maior relevância para o contexto atual. Agentes projetados para jogar efetivamente múltiplos jogos devem possuir a capacidade de adaptação ao ambiente no qual se encontram, determinando assim quais ações melhor se adequam a cada situação. A qualidade de um agente é medida pela distância entre suas pontuações e as pontuações obtidas por jogadores humanos. Este trabalho apresenta o desenvolvimento de um agente capaz de jogar múltiplos jogos, sem a necessidade de definir regras previamente, recebendo apenas a imagem da tela do jogo, a pontuação atual e se o estado atual representa um estado de fim de jogo. Para isto são apresentados os diagramas do desenvolvimento do agente, em conjunto com suas repectivas informações. Para provar a eficiência do agente, as pontuações obtidas nos jogos Space Invaders, Breakout, Demon Attack e Kung Fu Master foram comparadas com as pontuações obtidas por jogadores humanos. |
id |
UNIP_8de732bb9d7842e227efa58317ebc40f |
---|---|
oai_identifier_str |
oai:repositorio.unipampa.edu.br:riu/4787 |
network_acronym_str |
UNIP |
network_name_str |
Repositório Institucional da UNIPAMPA |
repository_id_str |
|
spelling |
Thielo, Marcelo ResendeAlmeida, Lucas Antunes de2020-02-26T17:26:24Z2020-02-26T17:26:24Z2019-11-29ALMEIDA, Lucas Antunes de. Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600. Orientador: Marcelo Resende Thielo. 2019. 67 p. Trabalho de Conclusão de Curso (Bacharel em Ciência da Computação) - Universidade Federal do Pampa, Curso de Ciência da Computação, Alegrete, 2019.http://dspace.unipampa.edu.br:8080/jspui/handle/riu/4787Dentre as áreas abordadas na Computação, a evolução da Inteligência Artificial vem se destacando, em especial na área de jogos. O objetivo deste trabalho é o desenvolvimento de um agente inteligente capaz de jogar múltiplos jogos. Para isto, primeiramente foi realizado um estudo sobre os conceitos necessários, os quais constituem toda a fundamentação teórica deste trabalho. Visando a abstração de conceitos de aprendizado de máquina e processamento de imagens, foram utilizadas as bibliotecas Keras e Gym. São apresentados modelos de Inteligência Artificial, Aprendizado de Máquina, Aprendizagem Profunda, Aprendizagem por Reforço, Aprendizagem por Reforço Profundo, Aprendizagem Q e Ator Crítico de Vantagem Assíncrono, adaptados para o contexto deste trabalho. Este trabalho realizou o levantamento do estado da arte na área de algoritmos para jogar jogos genéricos, apresentando os trabalhos que possuem maior relevância para o contexto atual. Agentes projetados para jogar efetivamente múltiplos jogos devem possuir a capacidade de adaptação ao ambiente no qual se encontram, determinando assim quais ações melhor se adequam a cada situação. A qualidade de um agente é medida pela distância entre suas pontuações e as pontuações obtidas por jogadores humanos. Este trabalho apresenta o desenvolvimento de um agente capaz de jogar múltiplos jogos, sem a necessidade de definir regras previamente, recebendo apenas a imagem da tela do jogo, a pontuação atual e se o estado atual representa um estado de fim de jogo. Para isto são apresentados os diagramas do desenvolvimento do agente, em conjunto com suas repectivas informações. Para provar a eficiência do agente, as pontuações obtidas nos jogos Space Invaders, Breakout, Demon Attack e Kung Fu Master foram comparadas com as pontuações obtidas por jogadores humanos.Among the areas addressed in Computing, the evolution of Artificial Intelligence has been highlighting, especially in the area of games. The aim of this paper is the development of an intelligent agent capable of multiplayer games. For this, a study was first made on the necessary concepts, which constitute all the theoretical foundations of this work. For the abstraction of machine learning and image processing concepts, we used the Keras and Gym libraries. This paper presents the definition of models of Artificial Intelligence, Machine Learning, Deep Learning, Reinforcement Learning, Deep Reinforcement Learning, Q Learning, and Asynchronous Advantage Actor-Critic adapted to the context of this work. This paper surveyed the state of the art in the area of algorithms for playing generic games, presenting the works that are most relevant to the current context. Agents designed to effectively play multiple games must have the ability to adapt to the environment in which they find themselves, thus determining which actions best suit each situation. The quality of an agent is measured by the distance between its scores and the scores obtained by human players. This paper presents the development of an agent capable of playing multiple games without the need to define rules in advance, receiving only the game screen image, the current score and whether the current state represents an endgame state. For this, the diagrams of agent development are presented, together with their respective information. To prove the effectiveness of the agent, the scores obtained in the Space Invaders, Breakout, Demon Attack, and Kung Fu Master games were compared to the scores obtained by human players.porUniversidade Federal do PampaUNIPAMPABrasilCampus AlegreteCNPQ::CIENCIAS EXATAS E DA TERRACiência da computaçãoAlgoritmosJogosInteligência artificialComputer scienceAlgorithmsGamesArtificial intelligenceDesenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIPAMPAinstname:Universidade Federal do Pampa (UNIPAMPA)instacron:UNIPAMPAORIGINALLucas Antunes de Almeida - 2019.pdfLucas Antunes de Almeida - 2019.pdfapplication/pdf2845187https://repositorio.unipampa.edu.br/jspui/bitstream/riu/4787/1/Lucas%20Antunes%20de%20Almeida%20-%202019.pdf9a9d36e106ffed4b34afacadfdcbd419MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81866https://repositorio.unipampa.edu.br/jspui/bitstream/riu/4787/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52TEXTLucas Antunes de Almeida - 2019.pdf.txtLucas Antunes de Almeida - 2019.pdf.txtExtracted texttext/plain76421https://repositorio.unipampa.edu.br/jspui/bitstream/riu/4787/3/Lucas%20Antunes%20de%20Almeida%20-%202019.pdf.txtbc4d8d401138fdba9d1c13b2d67646cdMD53riu/47872020-02-27 03:03:54.761oai:repositorio.unipampa.edu.br:riu/4787TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttp://dspace.unipampa.edu.br:8080/oai/requestsisbi@unipampa.edu.bropendoar:2020-02-27T06:03:54Repositório Institucional da UNIPAMPA - Universidade Federal do Pampa (UNIPAMPA)false |
dc.title.pt_BR.fl_str_mv |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 |
title |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 |
spellingShingle |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 Almeida, Lucas Antunes de CNPQ::CIENCIAS EXATAS E DA TERRA Ciência da computação Algoritmos Jogos Inteligência artificial Computer science Algorithms Games Artificial intelligence |
title_short |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 |
title_full |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 |
title_fullStr |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 |
title_full_unstemmed |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 |
title_sort |
Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600 |
author |
Almeida, Lucas Antunes de |
author_facet |
Almeida, Lucas Antunes de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Thielo, Marcelo Resende |
dc.contributor.author.fl_str_mv |
Almeida, Lucas Antunes de |
contributor_str_mv |
Thielo, Marcelo Resende |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA Ciência da computação Algoritmos Jogos Inteligência artificial Computer science Algorithms Games Artificial intelligence |
dc.subject.por.fl_str_mv |
Ciência da computação Algoritmos Jogos Inteligência artificial Computer science Algorithms Games Artificial intelligence |
description |
Dentre as áreas abordadas na Computação, a evolução da Inteligência Artificial vem se destacando, em especial na área de jogos. O objetivo deste trabalho é o desenvolvimento de um agente inteligente capaz de jogar múltiplos jogos. Para isto, primeiramente foi realizado um estudo sobre os conceitos necessários, os quais constituem toda a fundamentação teórica deste trabalho. Visando a abstração de conceitos de aprendizado de máquina e processamento de imagens, foram utilizadas as bibliotecas Keras e Gym. São apresentados modelos de Inteligência Artificial, Aprendizado de Máquina, Aprendizagem Profunda, Aprendizagem por Reforço, Aprendizagem por Reforço Profundo, Aprendizagem Q e Ator Crítico de Vantagem Assíncrono, adaptados para o contexto deste trabalho. Este trabalho realizou o levantamento do estado da arte na área de algoritmos para jogar jogos genéricos, apresentando os trabalhos que possuem maior relevância para o contexto atual. Agentes projetados para jogar efetivamente múltiplos jogos devem possuir a capacidade de adaptação ao ambiente no qual se encontram, determinando assim quais ações melhor se adequam a cada situação. A qualidade de um agente é medida pela distância entre suas pontuações e as pontuações obtidas por jogadores humanos. Este trabalho apresenta o desenvolvimento de um agente capaz de jogar múltiplos jogos, sem a necessidade de definir regras previamente, recebendo apenas a imagem da tela do jogo, a pontuação atual e se o estado atual representa um estado de fim de jogo. Para isto são apresentados os diagramas do desenvolvimento do agente, em conjunto com suas repectivas informações. Para provar a eficiência do agente, as pontuações obtidas nos jogos Space Invaders, Breakout, Demon Attack e Kung Fu Master foram comparadas com as pontuações obtidas por jogadores humanos. |
publishDate |
2019 |
dc.date.issued.fl_str_mv |
2019-11-29 |
dc.date.accessioned.fl_str_mv |
2020-02-26T17:26:24Z |
dc.date.available.fl_str_mv |
2020-02-26T17:26:24Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
ALMEIDA, Lucas Antunes de. Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600. Orientador: Marcelo Resende Thielo. 2019. 67 p. Trabalho de Conclusão de Curso (Bacharel em Ciência da Computação) - Universidade Federal do Pampa, Curso de Ciência da Computação, Alegrete, 2019. |
dc.identifier.uri.fl_str_mv |
http://dspace.unipampa.edu.br:8080/jspui/handle/riu/4787 |
identifier_str_mv |
ALMEIDA, Lucas Antunes de. Desenvolvimento de um agente inteligente para jogar jogos genéricos de Atari 2600. Orientador: Marcelo Resende Thielo. 2019. 67 p. Trabalho de Conclusão de Curso (Bacharel em Ciência da Computação) - Universidade Federal do Pampa, Curso de Ciência da Computação, Alegrete, 2019. |
url |
http://dspace.unipampa.edu.br:8080/jspui/handle/riu/4787 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Pampa |
dc.publisher.initials.fl_str_mv |
UNIPAMPA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Campus Alegrete |
publisher.none.fl_str_mv |
Universidade Federal do Pampa |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIPAMPA instname:Universidade Federal do Pampa (UNIPAMPA) instacron:UNIPAMPA |
instname_str |
Universidade Federal do Pampa (UNIPAMPA) |
instacron_str |
UNIPAMPA |
institution |
UNIPAMPA |
reponame_str |
Repositório Institucional da UNIPAMPA |
collection |
Repositório Institucional da UNIPAMPA |
bitstream.url.fl_str_mv |
https://repositorio.unipampa.edu.br/jspui/bitstream/riu/4787/1/Lucas%20Antunes%20de%20Almeida%20-%202019.pdf https://repositorio.unipampa.edu.br/jspui/bitstream/riu/4787/2/license.txt https://repositorio.unipampa.edu.br/jspui/bitstream/riu/4787/3/Lucas%20Antunes%20de%20Almeida%20-%202019.pdf.txt |
bitstream.checksum.fl_str_mv |
9a9d36e106ffed4b34afacadfdcbd419 43cd690d6a359e86c1fe3d5b7cba0c9b bc4d8d401138fdba9d1c13b2d67646cd |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UNIPAMPA - Universidade Federal do Pampa (UNIPAMPA) |
repository.mail.fl_str_mv |
sisbi@unipampa.edu.br |
_version_ |
1813274841680183296 |