Deep learning for bin picking object segmentation
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | eng |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/20989 |
Resumo: | Bin picking tendo como base técnicas de deep learning é uma tecnologia que adota um conceito recente para melhorar as abordagens padrões utilizando redes neuronais. Estas abordagens estão cada vez mais a ser aplicadas em áreas bin picking devido ao potencial das técnicas de deep learning para melhorar a inteligência e as capacidades de aprendizagem de robôs. Esta dissertação propõe uma técnica robusta e precisa para diversos objectos a granel usados em bin picking, aplicando uma framework com configuração fácil de ajustar de acordo com o objetivo e objetos pretendido. A framework é implementada em Robot Operating System (ROS) e é dividida em dois sistemas, de deteção e segmentação. O sistema de deteção recorre à rede neuronal de segmentação de instâncias Mask-RCNN para estimar as diversas máscaras, identificando e segmentando diversos objetos através de uma imagem de duas dimensões (2D) em tons de cinza. O sistema de segmentação utiliza como base point cloud library (PCL), manipulando informação de 3D point clouds conforme os resultados da deteção para selecionar os pontos específicos da point cloud original, gerando uma point cloud parcial como resultado. Além disso para completar o sistema de bin picking são implementadas abordagens de estimação de posição e localização baseado em algoritmos de correspondência, como Iterative Closest Point (ICP), assim como estimação de grasp. A implementação da deteção e segmentação foi testada em vários datasets para os dois objetos propostos (90º tubo em cotovelo e suporte de parede triangular) utilizando um Photoneo PhoXi S 3D scanner (sensor RGB-D), e um computador composto por um processador Ryzen 5 5600x, placa gráfica Gtx 1060 6GB e memória 32GB DDR4, exibindo uma precisão de 80%, recall de 92.25%, Intersection Over Union (IOU) de 89% e pontuação F1 de 89%. Executando o processo de deteção e segmentação, este consome entre 0.52 segundos e 0.85 segundos. A implementação completa foi realizada num robô industrial com um manipulador UR10, uma plataforma móvel e o mesmo sensor RGB-D, e esta incluí estimação de posição, localização e de ”grasping” para além da framework explicada de deteção e segmentação. A precisão observada e a capacidade de detetar objetos a granel em diversos ambientes desordenados possibilita a implementação do sistema em ambientes diversificados propícios para bin picking, ambientes quais são bastante observado em cenários de indústria, permitindo assim a deteção de diferentes objetos através de modelos específicos Mask-RCNN previamente treinados. |
id |
RCAP_2a1b16b8e75299590c70675c329267ac |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/20989 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Deep learning for bin picking object segmentationBin pickingDeep learningMask-RCNNGraspingROSRedes neuronaisInteligência artificialArtificial IntelligenceNeural networksBin picking tendo como base técnicas de deep learning é uma tecnologia que adota um conceito recente para melhorar as abordagens padrões utilizando redes neuronais. Estas abordagens estão cada vez mais a ser aplicadas em áreas bin picking devido ao potencial das técnicas de deep learning para melhorar a inteligência e as capacidades de aprendizagem de robôs. Esta dissertação propõe uma técnica robusta e precisa para diversos objectos a granel usados em bin picking, aplicando uma framework com configuração fácil de ajustar de acordo com o objetivo e objetos pretendido. A framework é implementada em Robot Operating System (ROS) e é dividida em dois sistemas, de deteção e segmentação. O sistema de deteção recorre à rede neuronal de segmentação de instâncias Mask-RCNN para estimar as diversas máscaras, identificando e segmentando diversos objetos através de uma imagem de duas dimensões (2D) em tons de cinza. O sistema de segmentação utiliza como base point cloud library (PCL), manipulando informação de 3D point clouds conforme os resultados da deteção para selecionar os pontos específicos da point cloud original, gerando uma point cloud parcial como resultado. Além disso para completar o sistema de bin picking são implementadas abordagens de estimação de posição e localização baseado em algoritmos de correspondência, como Iterative Closest Point (ICP), assim como estimação de grasp. A implementação da deteção e segmentação foi testada em vários datasets para os dois objetos propostos (90º tubo em cotovelo e suporte de parede triangular) utilizando um Photoneo PhoXi S 3D scanner (sensor RGB-D), e um computador composto por um processador Ryzen 5 5600x, placa gráfica Gtx 1060 6GB e memória 32GB DDR4, exibindo uma precisão de 80%, recall de 92.25%, Intersection Over Union (IOU) de 89% e pontuação F1 de 89%. Executando o processo de deteção e segmentação, este consome entre 0.52 segundos e 0.85 segundos. A implementação completa foi realizada num robô industrial com um manipulador UR10, uma plataforma móvel e o mesmo sensor RGB-D, e esta incluí estimação de posição, localização e de ”grasping” para além da framework explicada de deteção e segmentação. A precisão observada e a capacidade de detetar objetos a granel em diversos ambientes desordenados possibilita a implementação do sistema em ambientes diversificados propícios para bin picking, ambientes quais são bastante observado em cenários de indústria, permitindo assim a deteção de diferentes objetos através de modelos específicos Mask-RCNN previamente treinados.Bin picking based on deep learning techniques is a technology that applies a relatively recent concept, utilizing neural networks, intending to enhance the standard bin picking approaches. These approaches are increasingly being applied in bin picking areas due to the potential of deep learning policies to further increase the intelligence and learning capabilities of robots. This dissertation proposes a robust and accurate technique for random bin picking objects, employing an easy configuration to adjust the framework according to the intended object. The framework is implemented in Robot Operating System (ROS) and is divided into a detection and segmentation system, using Mask-RCNN instance segmentation neural network to handle the main detection system, identifying and segmenting several objects from a two dimensions (2D) grayscale image, and point cloud library (PCL) as a basis of the segmentation system, manipulating 3D point cloud data according to the detection results to select particular points of the original point cloud, generating a partial point cloud result. Furthermore, to complete the bin picking system is employed a pose and grasping estimation approach based on matching algorithms, such as Iterative Closest Point (ICP). The detection and segmentation implementation were tested in several datasets for two proposed objects (90º elbow tube and triangular wall support) using a Photoneo PhoXi S 3D scanner (RGB-D sensor), and a desktop computer composed by a Ryzen 5 5600x processor, Gtx 1060 6GB graphic card and 32GB DDR4 of memory, exhibiting high Average precision (Ap), Average recall (Ar), Intersection Over Union (IOU), and F1 score. Executing the full process consumes between 0.53 seconds to 0.85 seconds. The full implementation, including pose and grasping estimation, was tested in a real robot with a UR10 manipulator, a mobile platform and the same RGB-D sensor. The accuracy and capability of detecting objects in several cluttered environments provides the possibility of implementing the system in distinct bin picking environments, as in industry 4.0, allowing to detect of different objects with specific Mask-RCNN trained models, requiring only a neural network training stage to generate these models. The master thesis here presented was conducted under the European Union’s Horizon 2020—The EU Framework Programme for Research and Innovation 2014–2020, under grant agreement No.101006798—Project Mari4 YARD.Silva, Manuel Fernando dos SantosRepositório Científico do Instituto Politécnico do PortoCordeiro, Artur José Vilares2022-11-08T12:35:34Z20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/20989TID:203086457enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-13T13:16:48Zoai:recipp.ipp.pt:10400.22/20989Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:41:04.683405Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Deep learning for bin picking object segmentation |
title |
Deep learning for bin picking object segmentation |
spellingShingle |
Deep learning for bin picking object segmentation Cordeiro, Artur José Vilares Bin picking Deep learning Mask-RCNN Grasping ROS Redes neuronais Inteligência artificial Artificial Intelligence Neural networks |
title_short |
Deep learning for bin picking object segmentation |
title_full |
Deep learning for bin picking object segmentation |
title_fullStr |
Deep learning for bin picking object segmentation |
title_full_unstemmed |
Deep learning for bin picking object segmentation |
title_sort |
Deep learning for bin picking object segmentation |
author |
Cordeiro, Artur José Vilares |
author_facet |
Cordeiro, Artur José Vilares |
author_role |
author |
dc.contributor.none.fl_str_mv |
Silva, Manuel Fernando dos Santos Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Cordeiro, Artur José Vilares |
dc.subject.por.fl_str_mv |
Bin picking Deep learning Mask-RCNN Grasping ROS Redes neuronais Inteligência artificial Artificial Intelligence Neural networks |
topic |
Bin picking Deep learning Mask-RCNN Grasping ROS Redes neuronais Inteligência artificial Artificial Intelligence Neural networks |
description |
Bin picking tendo como base técnicas de deep learning é uma tecnologia que adota um conceito recente para melhorar as abordagens padrões utilizando redes neuronais. Estas abordagens estão cada vez mais a ser aplicadas em áreas bin picking devido ao potencial das técnicas de deep learning para melhorar a inteligência e as capacidades de aprendizagem de robôs. Esta dissertação propõe uma técnica robusta e precisa para diversos objectos a granel usados em bin picking, aplicando uma framework com configuração fácil de ajustar de acordo com o objetivo e objetos pretendido. A framework é implementada em Robot Operating System (ROS) e é dividida em dois sistemas, de deteção e segmentação. O sistema de deteção recorre à rede neuronal de segmentação de instâncias Mask-RCNN para estimar as diversas máscaras, identificando e segmentando diversos objetos através de uma imagem de duas dimensões (2D) em tons de cinza. O sistema de segmentação utiliza como base point cloud library (PCL), manipulando informação de 3D point clouds conforme os resultados da deteção para selecionar os pontos específicos da point cloud original, gerando uma point cloud parcial como resultado. Além disso para completar o sistema de bin picking são implementadas abordagens de estimação de posição e localização baseado em algoritmos de correspondência, como Iterative Closest Point (ICP), assim como estimação de grasp. A implementação da deteção e segmentação foi testada em vários datasets para os dois objetos propostos (90º tubo em cotovelo e suporte de parede triangular) utilizando um Photoneo PhoXi S 3D scanner (sensor RGB-D), e um computador composto por um processador Ryzen 5 5600x, placa gráfica Gtx 1060 6GB e memória 32GB DDR4, exibindo uma precisão de 80%, recall de 92.25%, Intersection Over Union (IOU) de 89% e pontuação F1 de 89%. Executando o processo de deteção e segmentação, este consome entre 0.52 segundos e 0.85 segundos. A implementação completa foi realizada num robô industrial com um manipulador UR10, uma plataforma móvel e o mesmo sensor RGB-D, e esta incluí estimação de posição, localização e de ”grasping” para além da framework explicada de deteção e segmentação. A precisão observada e a capacidade de detetar objetos a granel em diversos ambientes desordenados possibilita a implementação do sistema em ambientes diversificados propícios para bin picking, ambientes quais são bastante observado em cenários de indústria, permitindo assim a deteção de diferentes objetos através de modelos específicos Mask-RCNN previamente treinados. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-11-08T12:35:34Z 2022 2022-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/20989 TID:203086457 |
url |
http://hdl.handle.net/10400.22/20989 |
identifier_str_mv |
TID:203086457 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1817553782999875584 |