Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3

Detalhes bibliográficos
Autor(a) principal: Miranda, Eduardo da Silva
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.22/23969
Resumo: A gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI.
id RCAP_8feec1784e267113a0ce93993f33be77
oai_identifier_str oai:recipp.ipp.pt:10400.22/23969
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3Computer visionYOLOv3datasetwarehousedetection of industrial vehiclesDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI.Efficient management of industrial warehouses is essential to ensure the effectiveness of supply chains. Automation plays a crucial role in this context, with computer vision emerging as a valuable tool to enhance safety and efficiency. This study focuses on the application of the YOLOv3 (You Only Look Once) model for the detection of pedestrians and industrial vehicles in warehouses, such as forklifts and tugger trains. The YOLOv3 model was chosen as the backbone of the object detection solution due to its ability to swiftly and accurately detect multiple objects in real-time. In industrial warehouses, it is crucial to identify and monitor pedestrians and industrial vehicles to ensure safety and optimize operations. Traditionally, this task has been performed manually or through passive surveillance systems, which have limitations in terms of effectiveness, potentially leading to errors and accidents. In this project, a computer vision-based approach was adopted to overcome these limitations. The model training process involved the creation of a custom dataset with four classes: "person" (for pedestrian identification), "forklift" (for forklift identification), "tugger" (for tugger train identification), and "tugger loaded" (for identifying loaded tugger trains). Dataset annotation was done using LabelImg and drawing bounding boxes around the objects of interest and their corresponding classes. Data augmentation techniques were employed to diversify the dataset and improve the model's generalization. Model training was conducted on a laptop equipped with an Intel i7-12700H processor and an NVIDIA RTX 3060 graphics card. To accelerate the training process, the NVIDIA CUDA Tools tool was installed to utilize the graphics card effectively. The obtained results are promising since the model demonstrated a remarkable ability to swiftly and effectively detect pedestrians and industrial vehicles in various warehouse scenarios. This research contributes to the growing field of computer vision applied to industrial logistics, showcasing how an object detection model like YOLOv3 can be adapted and trained to meet the specific requirements of a warehouse environment. The success of this project underscores the potential of computer vision as a valuable tool to enhance safety and efficiency in complex industrial scenarios. Computer vision has the potential to revolutionize how industrial warehouses operate, making them safer, more efficient and better prepared for the logistical challenges of the 21st century.Marques Moura Gomes Viana, Paula MariaRepositório Científico do Instituto Politécnico do PortoMiranda, Eduardo da Silva2023-11-24T14:53:36Z2023-10-132023-10-13T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/23969TID:203380452porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-29T01:48:02Zoai:recipp.ipp.pt:10400.22/23969Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:19:59.952354Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
spellingShingle Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
Miranda, Eduardo da Silva
Computer vision
YOLOv3
dataset
warehouse
detection of industrial vehicles
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_full Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_fullStr Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_full_unstemmed Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_sort Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
author Miranda, Eduardo da Silva
author_facet Miranda, Eduardo da Silva
author_role author
dc.contributor.none.fl_str_mv Marques Moura Gomes Viana, Paula Maria
Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv Miranda, Eduardo da Silva
dc.subject.por.fl_str_mv Computer vision
YOLOv3
dataset
warehouse
detection of industrial vehicles
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Computer vision
YOLOv3
dataset
warehouse
detection of industrial vehicles
Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description A gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-24T14:53:36Z
2023-10-13
2023-10-13T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/23969
TID:203380452
url http://hdl.handle.net/10400.22/23969
identifier_str_mv TID:203380452
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799135499100618752