"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura

Biscaia, Gonçalo António Martins

"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura

Detalhes bibliográficos
Autor(a) principal:	Biscaia, Gonçalo António Martins
Data de Publicação:	2019
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10362/93424
Resumo:	O mercado encontra-se cada vez mais heterogéneo e individualizado. Com isto, existe a necessidade de desenvolver sistemas de produção que consigam produzir de uma forma otimizada e eficiente, produtos cada vez mais personalizados. Porém, estes sistemas estão a tornar-se cada vez mais complexos e consequentemente, os problemas inerentes a estes. O escalonamento da produção, de uma forma sintética, procura o fabrico de um produto, através da execução de diferentes trabalhos sobre matéria-prima, dentro de um prazo estipulado, visando o uso eficiente de recursos. Um problema intrínseco ao escalonamento da produção é a otimização de políticas de encaminhamento. A otimização de políticas de encaminhamento consiste em escolher o caminho de produção mais rápido, consoante vários fatores, como a posição de cada produto, ou quais os trabalhos ocupados num dado instante. São inúmeros os métodos utilizados para tentar otimizar políticas de encaminhamento numa linha de produção, sendo que dois dos utilizados são heurísticas e inteligência artificial, nomeadamente Reinforcement Learning (RL). Nesta dissertação é proposta a utilização de um algoritmo de Deep Reinforcement Learning (DRL), sendo este o algoritmo Double Deep Q-Network (Double-DQN), adaptado a um ambiente multi-agente. É feita a comparação de diferentes métricas, no que toca à otimização de políticas de encaminhamento, entre este algoritmo e os anteriormente referidos, em duas simulações de ambientes de produção distintos, com caraterísticas específicas, como duas ou mais zonas de trabalho iguais e diferentes escolhas de caminhos para a produção do produto. Dito isto, o objetivo é demonstrar a genericidade deste algoritmo a diferentes ambientes de produção, bem como comprovar a facilidade de o implementar em novos ambientes. Para além disto, é também provado que este é capaz de encontrar o caminho mais rápido de produção, nas simulações propostas, utilizando os algoritmos supracitados como termo de comparação.

Metadados do item

id	RCAP_2f82bf0c9e014dd6a4dd23940680ebad
oai_identifier_str	oai:run.unl.pt:10362/93424
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na ManufaturaEscalonamento na ProduçãoPolíticas de Otimização de EncaminhamentoInteligência ArtificialProduçãoAuto-EncaminhamentoDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaO mercado encontra-se cada vez mais heterogéneo e individualizado. Com isto, existe a necessidade de desenvolver sistemas de produção que consigam produzir de uma forma otimizada e eficiente, produtos cada vez mais personalizados. Porém, estes sistemas estão a tornar-se cada vez mais complexos e consequentemente, os problemas inerentes a estes. O escalonamento da produção, de uma forma sintética, procura o fabrico de um produto, através da execução de diferentes trabalhos sobre matéria-prima, dentro de um prazo estipulado, visando o uso eficiente de recursos. Um problema intrínseco ao escalonamento da produção é a otimização de políticas de encaminhamento. A otimização de políticas de encaminhamento consiste em escolher o caminho de produção mais rápido, consoante vários fatores, como a posição de cada produto, ou quais os trabalhos ocupados num dado instante. São inúmeros os métodos utilizados para tentar otimizar políticas de encaminhamento numa linha de produção, sendo que dois dos utilizados são heurísticas e inteligência artificial, nomeadamente Reinforcement Learning (RL). Nesta dissertação é proposta a utilização de um algoritmo de Deep Reinforcement Learning (DRL), sendo este o algoritmo Double Deep Q-Network (Double-DQN), adaptado a um ambiente multi-agente. É feita a comparação de diferentes métricas, no que toca à otimização de políticas de encaminhamento, entre este algoritmo e os anteriormente referidos, em duas simulações de ambientes de produção distintos, com caraterísticas específicas, como duas ou mais zonas de trabalho iguais e diferentes escolhas de caminhos para a produção do produto. Dito isto, o objetivo é demonstrar a genericidade deste algoritmo a diferentes ambientes de produção, bem como comprovar a facilidade de o implementar em novos ambientes. Para além disto, é também provado que este é capaz de encontrar o caminho mais rápido de produção, nas simulações propostas, utilizando os algoritmos supracitados como termo de comparação.Oliveira, JoséPeres, RicardoRUNBiscaia, Gonçalo António Martins2020-02-27T11:43:40Z2019-1220192019-12-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/93424porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T04:41:48Zoai:run.unl.pt:10362/93424Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:37:45.061648Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
title	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
spellingShingle	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura Biscaia, Gonçalo António Martins Escalonamento na Produção Políticas de Otimização de Encaminhamento Inteligência Artificial Produção Auto-Encaminhamento Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
title_full	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
title_fullStr	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
title_full_unstemmed	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
title_sort	"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
author	Biscaia, Gonçalo António Martins
author_facet	Biscaia, Gonçalo António Martins
author_role	author
dc.contributor.none.fl_str_mv	Oliveira, José Peres, Ricardo RUN
dc.contributor.author.fl_str_mv	Biscaia, Gonçalo António Martins
dc.subject.por.fl_str_mv	Escalonamento na Produção Políticas de Otimização de Encaminhamento Inteligência Artificial Produção Auto-Encaminhamento Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic	Escalonamento na Produção Políticas de Otimização de Encaminhamento Inteligência Artificial Produção Auto-Encaminhamento Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description	O mercado encontra-se cada vez mais heterogéneo e individualizado. Com isto, existe a necessidade de desenvolver sistemas de produção que consigam produzir de uma forma otimizada e eficiente, produtos cada vez mais personalizados. Porém, estes sistemas estão a tornar-se cada vez mais complexos e consequentemente, os problemas inerentes a estes. O escalonamento da produção, de uma forma sintética, procura o fabrico de um produto, através da execução de diferentes trabalhos sobre matéria-prima, dentro de um prazo estipulado, visando o uso eficiente de recursos. Um problema intrínseco ao escalonamento da produção é a otimização de políticas de encaminhamento. A otimização de políticas de encaminhamento consiste em escolher o caminho de produção mais rápido, consoante vários fatores, como a posição de cada produto, ou quais os trabalhos ocupados num dado instante. São inúmeros os métodos utilizados para tentar otimizar políticas de encaminhamento numa linha de produção, sendo que dois dos utilizados são heurísticas e inteligência artificial, nomeadamente Reinforcement Learning (RL). Nesta dissertação é proposta a utilização de um algoritmo de Deep Reinforcement Learning (DRL), sendo este o algoritmo Double Deep Q-Network (Double-DQN), adaptado a um ambiente multi-agente. É feita a comparação de diferentes métricas, no que toca à otimização de políticas de encaminhamento, entre este algoritmo e os anteriormente referidos, em duas simulações de ambientes de produção distintos, com caraterísticas específicas, como duas ou mais zonas de trabalho iguais e diferentes escolhas de caminhos para a produção do produto. Dito isto, o objetivo é demonstrar a genericidade deste algoritmo a diferentes ambientes de produção, bem como comprovar a facilidade de o implementar em novos ambientes. Para além disto, é também provado que este é capaz de encontrar o caminho mais rápido de produção, nas simulações propostas, utilizando os algoritmos supracitados como termo de comparação.
publishDate	2019
dc.date.none.fl_str_mv	2019-12 2019 2019-12-01T00:00:00Z 2020-02-27T11:43:40Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10362/93424
url	http://hdl.handle.net/10362/93424
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799137994273193984

"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura

Registros relacionados