"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10362/93424 |
Resumo: | O mercado encontra-se cada vez mais heterogéneo e individualizado. Com isto, existe a necessidade de desenvolver sistemas de produção que consigam produzir de uma forma otimizada e eficiente, produtos cada vez mais personalizados. Porém, estes sistemas estão a tornar-se cada vez mais complexos e consequentemente, os problemas inerentes a estes. O escalonamento da produção, de uma forma sintética, procura o fabrico de um produto, através da execução de diferentes trabalhos sobre matéria-prima, dentro de um prazo estipulado, visando o uso eficiente de recursos. Um problema intrínseco ao escalonamento da produção é a otimização de políticas de encaminhamento. A otimização de políticas de encaminhamento consiste em escolher o caminho de produção mais rápido, consoante vários fatores, como a posição de cada produto, ou quais os trabalhos ocupados num dado instante. São inúmeros os métodos utilizados para tentar otimizar políticas de encaminhamento numa linha de produção, sendo que dois dos utilizados são heurísticas e inteligência artificial, nomeadamente Reinforcement Learning (RL). Nesta dissertação é proposta a utilização de um algoritmo de Deep Reinforcement Learning (DRL), sendo este o algoritmo Double Deep Q-Network (Double-DQN), adaptado a um ambiente multi-agente. É feita a comparação de diferentes métricas, no que toca à otimização de políticas de encaminhamento, entre este algoritmo e os anteriormente referidos, em duas simulações de ambientes de produção distintos, com caraterísticas específicas, como duas ou mais zonas de trabalho iguais e diferentes escolhas de caminhos para a produção do produto. Dito isto, o objetivo é demonstrar a genericidade deste algoritmo a diferentes ambientes de produção, bem como comprovar a facilidade de o implementar em novos ambientes. Para além disto, é também provado que este é capaz de encontrar o caminho mais rápido de produção, nas simulações propostas, utilizando os algoritmos supracitados como termo de comparação. |
id |
RCAP_2f82bf0c9e014dd6a4dd23940680ebad |
---|---|
oai_identifier_str |
oai:run.unl.pt:10362/93424 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na ManufaturaEscalonamento na ProduçãoPolíticas de Otimização de EncaminhamentoInteligência ArtificialProduçãoAuto-EncaminhamentoDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaO mercado encontra-se cada vez mais heterogéneo e individualizado. Com isto, existe a necessidade de desenvolver sistemas de produção que consigam produzir de uma forma otimizada e eficiente, produtos cada vez mais personalizados. Porém, estes sistemas estão a tornar-se cada vez mais complexos e consequentemente, os problemas inerentes a estes. O escalonamento da produção, de uma forma sintética, procura o fabrico de um produto, através da execução de diferentes trabalhos sobre matéria-prima, dentro de um prazo estipulado, visando o uso eficiente de recursos. Um problema intrínseco ao escalonamento da produção é a otimização de políticas de encaminhamento. A otimização de políticas de encaminhamento consiste em escolher o caminho de produção mais rápido, consoante vários fatores, como a posição de cada produto, ou quais os trabalhos ocupados num dado instante. São inúmeros os métodos utilizados para tentar otimizar políticas de encaminhamento numa linha de produção, sendo que dois dos utilizados são heurísticas e inteligência artificial, nomeadamente Reinforcement Learning (RL). Nesta dissertação é proposta a utilização de um algoritmo de Deep Reinforcement Learning (DRL), sendo este o algoritmo Double Deep Q-Network (Double-DQN), adaptado a um ambiente multi-agente. É feita a comparação de diferentes métricas, no que toca à otimização de políticas de encaminhamento, entre este algoritmo e os anteriormente referidos, em duas simulações de ambientes de produção distintos, com caraterísticas específicas, como duas ou mais zonas de trabalho iguais e diferentes escolhas de caminhos para a produção do produto. Dito isto, o objetivo é demonstrar a genericidade deste algoritmo a diferentes ambientes de produção, bem como comprovar a facilidade de o implementar em novos ambientes. Para além disto, é também provado que este é capaz de encontrar o caminho mais rápido de produção, nas simulações propostas, utilizando os algoritmos supracitados como termo de comparação.Oliveira, JoséPeres, RicardoRUNBiscaia, Gonçalo António Martins2020-02-27T11:43:40Z2019-1220192019-12-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/93424porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-03-11T04:41:48Zoai:run.unl.pt:10362/93424Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T03:37:45.061648Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura |
title |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura |
spellingShingle |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura Biscaia, Gonçalo António Martins Escalonamento na Produção Políticas de Otimização de Encaminhamento Inteligência Artificial Produção Auto-Encaminhamento Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura |
title_full |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura |
title_fullStr |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura |
title_full_unstemmed |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura |
title_sort |
"Deep Reinforcement Learning" na Otimização de Políticas de Encaminhamento na Manufatura |
author |
Biscaia, Gonçalo António Martins |
author_facet |
Biscaia, Gonçalo António Martins |
author_role |
author |
dc.contributor.none.fl_str_mv |
Oliveira, José Peres, Ricardo RUN |
dc.contributor.author.fl_str_mv |
Biscaia, Gonçalo António Martins |
dc.subject.por.fl_str_mv |
Escalonamento na Produção Políticas de Otimização de Encaminhamento Inteligência Artificial Produção Auto-Encaminhamento Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Escalonamento na Produção Políticas de Otimização de Encaminhamento Inteligência Artificial Produção Auto-Encaminhamento Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
O mercado encontra-se cada vez mais heterogéneo e individualizado. Com isto, existe a necessidade de desenvolver sistemas de produção que consigam produzir de uma forma otimizada e eficiente, produtos cada vez mais personalizados. Porém, estes sistemas estão a tornar-se cada vez mais complexos e consequentemente, os problemas inerentes a estes. O escalonamento da produção, de uma forma sintética, procura o fabrico de um produto, através da execução de diferentes trabalhos sobre matéria-prima, dentro de um prazo estipulado, visando o uso eficiente de recursos. Um problema intrínseco ao escalonamento da produção é a otimização de políticas de encaminhamento. A otimização de políticas de encaminhamento consiste em escolher o caminho de produção mais rápido, consoante vários fatores, como a posição de cada produto, ou quais os trabalhos ocupados num dado instante. São inúmeros os métodos utilizados para tentar otimizar políticas de encaminhamento numa linha de produção, sendo que dois dos utilizados são heurísticas e inteligência artificial, nomeadamente Reinforcement Learning (RL). Nesta dissertação é proposta a utilização de um algoritmo de Deep Reinforcement Learning (DRL), sendo este o algoritmo Double Deep Q-Network (Double-DQN), adaptado a um ambiente multi-agente. É feita a comparação de diferentes métricas, no que toca à otimização de políticas de encaminhamento, entre este algoritmo e os anteriormente referidos, em duas simulações de ambientes de produção distintos, com caraterísticas específicas, como duas ou mais zonas de trabalho iguais e diferentes escolhas de caminhos para a produção do produto. Dito isto, o objetivo é demonstrar a genericidade deste algoritmo a diferentes ambientes de produção, bem como comprovar a facilidade de o implementar em novos ambientes. Para além disto, é também provado que este é capaz de encontrar o caminho mais rápido de produção, nas simulações propostas, utilizando os algoritmos supracitados como termo de comparação. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-12 2019 2019-12-01T00:00:00Z 2020-02-27T11:43:40Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10362/93424 |
url |
http://hdl.handle.net/10362/93424 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137994273193984 |