Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/23969 |
Resumo: | A gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI. |
id |
RCAP_8feec1784e267113a0ce93993f33be77 |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/23969 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3Computer visionYOLOv3datasetwarehousedetection of industrial vehiclesDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI.Efficient management of industrial warehouses is essential to ensure the effectiveness of supply chains. Automation plays a crucial role in this context, with computer vision emerging as a valuable tool to enhance safety and efficiency. This study focuses on the application of the YOLOv3 (You Only Look Once) model for the detection of pedestrians and industrial vehicles in warehouses, such as forklifts and tugger trains. The YOLOv3 model was chosen as the backbone of the object detection solution due to its ability to swiftly and accurately detect multiple objects in real-time. In industrial warehouses, it is crucial to identify and monitor pedestrians and industrial vehicles to ensure safety and optimize operations. Traditionally, this task has been performed manually or through passive surveillance systems, which have limitations in terms of effectiveness, potentially leading to errors and accidents. In this project, a computer vision-based approach was adopted to overcome these limitations. The model training process involved the creation of a custom dataset with four classes: "person" (for pedestrian identification), "forklift" (for forklift identification), "tugger" (for tugger train identification), and "tugger loaded" (for identifying loaded tugger trains). Dataset annotation was done using LabelImg and drawing bounding boxes around the objects of interest and their corresponding classes. Data augmentation techniques were employed to diversify the dataset and improve the model's generalization. Model training was conducted on a laptop equipped with an Intel i7-12700H processor and an NVIDIA RTX 3060 graphics card. To accelerate the training process, the NVIDIA CUDA Tools tool was installed to utilize the graphics card effectively. The obtained results are promising since the model demonstrated a remarkable ability to swiftly and effectively detect pedestrians and industrial vehicles in various warehouse scenarios. This research contributes to the growing field of computer vision applied to industrial logistics, showcasing how an object detection model like YOLOv3 can be adapted and trained to meet the specific requirements of a warehouse environment. The success of this project underscores the potential of computer vision as a valuable tool to enhance safety and efficiency in complex industrial scenarios. Computer vision has the potential to revolutionize how industrial warehouses operate, making them safer, more efficient and better prepared for the logistical challenges of the 21st century.Marques Moura Gomes Viana, Paula MariaRepositório Científico do Instituto Politécnico do PortoMiranda, Eduardo da Silva2023-11-24T14:53:36Z2023-10-132023-10-13T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/23969TID:203380452porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-29T01:48:02Zoai:recipp.ipp.pt:10400.22/23969Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:19:59.952354Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 |
title |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 |
spellingShingle |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 Miranda, Eduardo da Silva Computer vision YOLOv3 dataset warehouse detection of industrial vehicles Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 |
title_full |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 |
title_fullStr |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 |
title_full_unstemmed |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 |
title_sort |
Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 |
author |
Miranda, Eduardo da Silva |
author_facet |
Miranda, Eduardo da Silva |
author_role |
author |
dc.contributor.none.fl_str_mv |
Marques Moura Gomes Viana, Paula Maria Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Miranda, Eduardo da Silva |
dc.subject.por.fl_str_mv |
Computer vision YOLOv3 dataset warehouse detection of industrial vehicles Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Computer vision YOLOv3 dataset warehouse detection of industrial vehicles Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
A gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-11-24T14:53:36Z 2023-10-13 2023-10-13T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/23969 TID:203380452 |
url |
http://hdl.handle.net/10400.22/23969 |
identifier_str_mv |
TID:203380452 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799135499100618752 |