Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3

Miranda, Eduardo da Silva

Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3

Detalhes bibliográficos
Autor(a) principal:	Miranda, Eduardo da Silva
Data de Publicação:	2023
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo:	http://hdl.handle.net/10400.22/23969
Resumo:	A gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI.

Metadados do item

id	RCAP_8feec1784e267113a0ce93993f33be77
oai_identifier_str	oai:recipp.ipp.pt:10400.22/23969
network_acronym_str	RCAP
network_name_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str	7160
spelling	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3Computer visionYOLOv3datasetwarehousedetection of industrial vehiclesDomínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaA gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI.Efficient management of industrial warehouses is essential to ensure the effectiveness of supply chains. Automation plays a crucial role in this context, with computer vision emerging as a valuable tool to enhance safety and efficiency. This study focuses on the application of the YOLOv3 (You Only Look Once) model for the detection of pedestrians and industrial vehicles in warehouses, such as forklifts and tugger trains. The YOLOv3 model was chosen as the backbone of the object detection solution due to its ability to swiftly and accurately detect multiple objects in real-time. In industrial warehouses, it is crucial to identify and monitor pedestrians and industrial vehicles to ensure safety and optimize operations. Traditionally, this task has been performed manually or through passive surveillance systems, which have limitations in terms of effectiveness, potentially leading to errors and accidents. In this project, a computer vision-based approach was adopted to overcome these limitations. The model training process involved the creation of a custom dataset with four classes: "person" (for pedestrian identification), "forklift" (for forklift identification), "tugger" (for tugger train identification), and "tugger loaded" (for identifying loaded tugger trains). Dataset annotation was done using LabelImg and drawing bounding boxes around the objects of interest and their corresponding classes. Data augmentation techniques were employed to diversify the dataset and improve the model's generalization. Model training was conducted on a laptop equipped with an Intel i7-12700H processor and an NVIDIA RTX 3060 graphics card. To accelerate the training process, the NVIDIA CUDA Tools tool was installed to utilize the graphics card effectively. The obtained results are promising since the model demonstrated a remarkable ability to swiftly and effectively detect pedestrians and industrial vehicles in various warehouse scenarios. This research contributes to the growing field of computer vision applied to industrial logistics, showcasing how an object detection model like YOLOv3 can be adapted and trained to meet the specific requirements of a warehouse environment. The success of this project underscores the potential of computer vision as a valuable tool to enhance safety and efficiency in complex industrial scenarios. Computer vision has the potential to revolutionize how industrial warehouses operate, making them safer, more efficient and better prepared for the logistical challenges of the 21st century.Marques Moura Gomes Viana, Paula MariaRepositório Científico do Instituto Politécnico do PortoMiranda, Eduardo da Silva2023-11-24T14:53:36Z2023-10-132023-10-13T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/23969TID:203380452porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-11-29T01:48:02Zoai:recipp.ipp.pt:10400.22/23969Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T23:19:59.952354Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
spellingShingle	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3 Miranda, Eduardo da Silva Computer vision YOLOv3 dataset warehouse detection of industrial vehicles Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_full	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_fullStr	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_full_unstemmed	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
title_sort	Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3
author	Miranda, Eduardo da Silva
author_facet	Miranda, Eduardo da Silva
author_role	author
dc.contributor.none.fl_str_mv	Marques Moura Gomes Viana, Paula Maria Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv	Miranda, Eduardo da Silva
dc.subject.por.fl_str_mv	Computer vision YOLOv3 dataset warehouse detection of industrial vehicles Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic	Computer vision YOLOv3 dataset warehouse detection of industrial vehicles Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description	A gestão eficiente de armazéns industriais é essencial para garantir a eficácia das cadeias de abastecimento. A automação desempenha um papel crucial nesse contexto, com a visão computacional a surgir como uma ferramenta valiosa para melhorar a segurança e a eficiência das operações de um armazém. Este estudo concentra-se na aplicação do modelo YOLOv3 (You Only Look Once) para a deteção de pedestres e veículos industriais, como empilhadoras e tugger trains, em armazéns. O modelo YOLOv3 foi escolhido como a espinha dorsal da solução de deteção de objetos devido à sua capacidade de detetar múltiplos objetos em tempo real com rapidez e precisão. Em armazéns industriais é crucial identificar e monitorizar pedestres e veículos industriais para garantir a segurança dos operadores e otimizar as operações logísticas. Tradicionalmente, essa tarefa é executada manualmente ou por meio de sistemas de vigilância passiva que têm limitações em termos de eficácia o que pode resultar em erros e, consequentemente, acidentes. Neste trabalho, adotou-se uma abordagem baseada na visão computacional para superar essas limitações. O processo de treino do modelo envolveu a criação de um dataset personalizado com quatro classes: "person" (para a identificação de pedestres), "forklift" (para a identificação de empilhadoras), "tugger" (para a identificação de tugger trains) e "tugger loaded” (para a identificação de tugger trains com carga). A anotação do dataset foi realizada através do software LabelImg onde foram desenhadas caixas delimitadoras nos objetos de interesse e, também, distribuídos pelas classes. Utilizaram-se técnicas de data augmentation para diversificar o dataset e melhorar a capacidade de generalização do modelo. O treino do modelo foi realizado num computador portátil com um processador Intel i7-12700H e com uma placa gráfica NVIDIA RTX 3060 laptop edition. Para se conseguir utilizar a placa gráfica de modo a acelerar o processo de treino foi instalada a ferramenta CUDA Tools (versão 11.7) da NVIDIA. Os resultados obtidos são promissores uma vez que o modelo demonstrou uma notável capacidade de detetar pedestres e veículos industriais em vários cenários de armazém de forma rápida e eficaz. Esta pesquisa contribui para a crescente área de visão computacional aplicada à logística industrial, demonstrando como um modelo de deteção de objetos como o YOLOv3 pode ser adaptado e treinado para atender às necessidades específicas de um ambiente de armazém. O sucesso deste projeto destaca o potencial da visão computacional como uma ferramenta valiosa para melhorar a segurança e a eficiência em ambientes industriais complexos. A visão computacional tem o potencial de revolucionar a forma como os armazéns industriais operam, tornando-os mais seguros, eficientes e preparados para os desafios logísticos do século XXI.
publishDate	2023
dc.date.none.fl_str_mv	2023-11-24T14:53:36Z 2023-10-13 2023-10-13T00:00:00Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10400.22/23969 TID:203380452
url	http://hdl.handle.net/10400.22/23969
identifier_str_mv	TID:203380452
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP
instname_str	Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str	RCAAP
institution	RCAAP
reponame_str	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv	Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_	1799135499100618752

Deteção de Veículos Industriais e Pedestres em armazéns utilizando YOLOv3

Registros relacionados