Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação

Vieira, Vinícius Ribeiro; Ferreira, Jonny Farias Vicente

Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação

Detalhes bibliográficos
Autor(a) principal:	Vieira, Vinícius Ribeiro
Data de Publicação:	2022
Outros Autores:	Ferreira, Jonny Farias Vicente
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFRJ
Texto Completo:	http://hdl.handle.net/11422/19377
Resumo:	Os avanços computacionais dos últimos 50 anos permitiram a elevação da inteligência artificial a novos patamares. Nesse contexto, surgiu o reinforcement learning: uma metodologia que permite aprender a ação a ser tomada e mapear situações de forma a realizar uma tarefa. Nos dias de hoje, essa metodologia pode ser encontrada em diversas áreas, como robótica, finanças, marketing e controle e automação, como ilustra este projeto. Este trabalho utiliza desta técnica para desenvolver uma metodologia em Python com as bibliotecas Numpy, Scipy e Pandas baseada em três passos para implementar um controlador de nível de tanque e aplicá-lo em simulações de sistemas diferentes aos quais fora treinado com o objetivo de avaliar a influência do aprendizado online no seu desempenho. O primeiro passo se tratou do treinamento offline do controlador. Já o segundo passo, foi realizado o treinamento online do controlador no sistema de pior desempenho. Por fim, no terceiro passo foi feito a comparação entre a resposta do controlador referente aos dois treinamentos. Os resultados evidenciam a robustez do controlador, adaptando-se aos diferentes cenários, assim como a melhor resposta que o aprendizado online pode proporcionar.

Metadados do item

id	UFRJ_3dd4002c2a91ddca5e6041fb6354edf2
oai_identifier_str	oai:pantheon.ufrj.br:11422/19377
network_acronym_str	UFRJ
network_name_str	Repositório Institucional da UFRJ
repository_id_str
spelling	Vieira, Vinícius RibeiroFerreira, Jonny Farias Vicentehttp://lattes.cnpq.br/3006635957267883http://lattes.cnpq.br/9536668836352750Alberton, Kese Pontes Freitashttp://lattes.cnpq.br/6508408949800887Torraca Neto, José Rodrigueshttp://lattes.cnpq.br/5656727173285055Viana, Marcelo Mendeshttp://lattes.cnpq.br/2879216880730517Capron, Bruno Didier Olivier2022-12-14T19:22:04Z2023-11-30T03:05:24Z2022-11-23http://hdl.handle.net/11422/19377Submitted by Fábio Ferreira (fabio.ferreira@eq.ufrj.br) on 2022-12-14T19:22:04Z No. of bitstreams: 1 VRVieira.pdf: 465911 bytes, checksum: c2c0a4b41447012bfff811599b89f829 (MD5)Made available in DSpace on 2022-12-14T19:22:04Z (GMT). No. of bitstreams: 1 VRVieira.pdf: 465911 bytes, checksum: c2c0a4b41447012bfff811599b89f829 (MD5) Previous issue date: 2022-11-23Os avanços computacionais dos últimos 50 anos permitiram a elevação da inteligência artificial a novos patamares. Nesse contexto, surgiu o reinforcement learning: uma metodologia que permite aprender a ação a ser tomada e mapear situações de forma a realizar uma tarefa. Nos dias de hoje, essa metodologia pode ser encontrada em diversas áreas, como robótica, finanças, marketing e controle e automação, como ilustra este projeto. Este trabalho utiliza desta técnica para desenvolver uma metodologia em Python com as bibliotecas Numpy, Scipy e Pandas baseada em três passos para implementar um controlador de nível de tanque e aplicá-lo em simulações de sistemas diferentes aos quais fora treinado com o objetivo de avaliar a influência do aprendizado online no seu desempenho. O primeiro passo se tratou do treinamento offline do controlador. Já o segundo passo, foi realizado o treinamento online do controlador no sistema de pior desempenho. Por fim, no terceiro passo foi feito a comparação entre a resposta do controlador referente aos dois treinamentos. Os resultados evidenciam a robustez do controlador, adaptando-se aos diferentes cenários, assim como a melhor resposta que o aprendizado online pode proporcionar.porUniversidade Federal do Rio de JaneiroUFRJBrasilEscola de QuímicaCNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICAInteligência artificialReinforcement learningDesenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulaçãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJLICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/19377/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD52ORIGINALVRVieira.pdfVRVieira.pdfapplication/pdf465911http://pantheon.ufrj.br:80/bitstream/11422/19377/1/VRVieira.pdfc2c0a4b41447012bfff811599b89f829MD5111422/193772023-11-30 00:05:24.079oai:pantheon.ufrj.br:11422/19377TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:05:24Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.pt_BR.fl_str_mv	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação
title	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação
spellingShingle	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação Vieira, Vinícius Ribeiro CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICA Inteligência artificial Reinforcement learning
title_short	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação
title_full	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação
title_fullStr	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação
title_full_unstemmed	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação
title_sort	Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação
author	Vieira, Vinícius Ribeiro
author_facet	Vieira, Vinícius Ribeiro Ferreira, Jonny Farias Vicente
author_role	author
author2	Ferreira, Jonny Farias Vicente
author2_role	author
dc.contributor.advisorLattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/3006635957267883
dc.contributor.authorLattes.pt_BR.fl_str_mv	http://lattes.cnpq.br/9536668836352750
dc.contributor.author.fl_str_mv	Vieira, Vinícius Ribeiro Ferreira, Jonny Farias Vicente
dc.contributor.referee1.fl_str_mv	Alberton, Kese Pontes Freitas
dc.contributor.referee1Lattes.fl_str_mv	http://lattes.cnpq.br/6508408949800887
dc.contributor.referee2.fl_str_mv	Torraca Neto, José Rodrigues
dc.contributor.referee2Lattes.fl_str_mv	http://lattes.cnpq.br/5656727173285055
dc.contributor.referee3.fl_str_mv	Viana, Marcelo Mendes
dc.contributor.referee3Lattes.fl_str_mv	http://lattes.cnpq.br/2879216880730517
dc.contributor.advisor1.fl_str_mv	Capron, Bruno Didier Olivier
contributor_str_mv	Alberton, Kese Pontes Freitas Torraca Neto, José Rodrigues Viana, Marcelo Mendes Capron, Bruno Didier Olivier
dc.subject.cnpq.fl_str_mv	CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICA
topic	CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICA Inteligência artificial Reinforcement learning
dc.subject.por.fl_str_mv	Inteligência artificial Reinforcement learning
description	Os avanços computacionais dos últimos 50 anos permitiram a elevação da inteligência artificial a novos patamares. Nesse contexto, surgiu o reinforcement learning: uma metodologia que permite aprender a ação a ser tomada e mapear situações de forma a realizar uma tarefa. Nos dias de hoje, essa metodologia pode ser encontrada em diversas áreas, como robótica, finanças, marketing e controle e automação, como ilustra este projeto. Este trabalho utiliza desta técnica para desenvolver uma metodologia em Python com as bibliotecas Numpy, Scipy e Pandas baseada em três passos para implementar um controlador de nível de tanque e aplicá-lo em simulações de sistemas diferentes aos quais fora treinado com o objetivo de avaliar a influência do aprendizado online no seu desempenho. O primeiro passo se tratou do treinamento offline do controlador. Já o segundo passo, foi realizado o treinamento online do controlador no sistema de pior desempenho. Por fim, no terceiro passo foi feito a comparação entre a resposta do controlador referente aos dois treinamentos. Os resultados evidenciam a robustez do controlador, adaptando-se aos diferentes cenários, assim como a melhor resposta que o aprendizado online pode proporcionar.
publishDate	2022
dc.date.accessioned.fl_str_mv	2022-12-14T19:22:04Z
dc.date.issued.fl_str_mv	2022-11-23
dc.date.available.fl_str_mv	2023-11-30T03:05:24Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/11422/19377
url	http://hdl.handle.net/11422/19377
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal do Rio de Janeiro
dc.publisher.initials.fl_str_mv	UFRJ
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Escola de Química
publisher.none.fl_str_mv	Universidade Federal do Rio de Janeiro
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ
instname_str	Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str	UFRJ
institution	UFRJ
reponame_str	Repositório Institucional da UFRJ
collection	Repositório Institucional da UFRJ
bitstream.url.fl_str_mv	http://pantheon.ufrj.br:80/bitstream/11422/19377/2/license.txt http://pantheon.ufrj.br:80/bitstream/11422/19377/1/VRVieira.pdf
bitstream.checksum.fl_str_mv	dd32849f2bfb22da963c3aac6e26e255 c2c0a4b41447012bfff811599b89f829
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv
_version_	1784097274260881408

Desenvolvimento e aplicação de uma metodologia para a implementação de um controlador baseado em aprendizado por reforço do nível de um tanque a partir da simulação

Registros relacionados