Deep learning for bin picking object segmentation

Detalhes bibliográficos
Autor(a) principal: Cordeiro, Artur José Vilares
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.22/20989
Resumo: Bin picking tendo como base técnicas de deep learning é uma tecnologia que adota um conceito recente para melhorar as abordagens padrões utilizando redes neuronais. Estas abordagens estão cada vez mais a ser aplicadas em áreas bin picking devido ao potencial das técnicas de deep learning para melhorar a inteligência e as capacidades de aprendizagem de robôs. Esta dissertação propõe uma técnica robusta e precisa para diversos objectos a granel usados em bin picking, aplicando uma framework com configuração fácil de ajustar de acordo com o objetivo e objetos pretendido. A framework é implementada em Robot Operating System (ROS) e é dividida em dois sistemas, de deteção e segmentação. O sistema de deteção recorre à rede neuronal de segmentação de instâncias Mask-RCNN para estimar as diversas máscaras, identificando e segmentando diversos objetos através de uma imagem de duas dimensões (2D) em tons de cinza. O sistema de segmentação utiliza como base point cloud library (PCL), manipulando informação de 3D point clouds conforme os resultados da deteção para selecionar os pontos específicos da point cloud original, gerando uma point cloud parcial como resultado. Além disso para completar o sistema de bin picking são implementadas abordagens de estimação de posição e localização baseado em algoritmos de correspondência, como Iterative Closest Point (ICP), assim como estimação de grasp. A implementação da deteção e segmentação foi testada em vários datasets para os dois objetos propostos (90º tubo em cotovelo e suporte de parede triangular) utilizando um Photoneo PhoXi S 3D scanner (sensor RGB-D), e um computador composto por um processador Ryzen 5 5600x, placa gráfica Gtx 1060 6GB e memória 32GB DDR4, exibindo uma precisão de 80%, recall de 92.25%, Intersection Over Union (IOU) de 89% e pontuação F1 de 89%. Executando o processo de deteção e segmentação, este consome entre 0.52 segundos e 0.85 segundos. A implementação completa foi realizada num robô industrial com um manipulador UR10, uma plataforma móvel e o mesmo sensor RGB-D, e esta incluí estimação de posição, localização e de ”grasping” para além da framework explicada de deteção e segmentação. A precisão observada e a capacidade de detetar objetos a granel em diversos ambientes desordenados possibilita a implementação do sistema em ambientes diversificados propícios para bin picking, ambientes quais são bastante observado em cenários de indústria, permitindo assim a deteção de diferentes objetos através de modelos específicos Mask-RCNN previamente treinados.
id RCAP_2a1b16b8e75299590c70675c329267ac
oai_identifier_str oai:recipp.ipp.pt:10400.22/20989
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Deep learning for bin picking object segmentationBin pickingDeep learningMask-RCNNGraspingROSRedes neuronaisInteligência artificialArtificial IntelligenceNeural networksBin picking tendo como base técnicas de deep learning é uma tecnologia que adota um conceito recente para melhorar as abordagens padrões utilizando redes neuronais. Estas abordagens estão cada vez mais a ser aplicadas em áreas bin picking devido ao potencial das técnicas de deep learning para melhorar a inteligência e as capacidades de aprendizagem de robôs. Esta dissertação propõe uma técnica robusta e precisa para diversos objectos a granel usados em bin picking, aplicando uma framework com configuração fácil de ajustar de acordo com o objetivo e objetos pretendido. A framework é implementada em Robot Operating System (ROS) e é dividida em dois sistemas, de deteção e segmentação. O sistema de deteção recorre à rede neuronal de segmentação de instâncias Mask-RCNN para estimar as diversas máscaras, identificando e segmentando diversos objetos através de uma imagem de duas dimensões (2D) em tons de cinza. O sistema de segmentação utiliza como base point cloud library (PCL), manipulando informação de 3D point clouds conforme os resultados da deteção para selecionar os pontos específicos da point cloud original, gerando uma point cloud parcial como resultado. Além disso para completar o sistema de bin picking são implementadas abordagens de estimação de posição e localização baseado em algoritmos de correspondência, como Iterative Closest Point (ICP), assim como estimação de grasp. A implementação da deteção e segmentação foi testada em vários datasets para os dois objetos propostos (90º tubo em cotovelo e suporte de parede triangular) utilizando um Photoneo PhoXi S 3D scanner (sensor RGB-D), e um computador composto por um processador Ryzen 5 5600x, placa gráfica Gtx 1060 6GB e memória 32GB DDR4, exibindo uma precisão de 80%, recall de 92.25%, Intersection Over Union (IOU) de 89% e pontuação F1 de 89%. Executando o processo de deteção e segmentação, este consome entre 0.52 segundos e 0.85 segundos. A implementação completa foi realizada num robô industrial com um manipulador UR10, uma plataforma móvel e o mesmo sensor RGB-D, e esta incluí estimação de posição, localização e de ”grasping” para além da framework explicada de deteção e segmentação. A precisão observada e a capacidade de detetar objetos a granel em diversos ambientes desordenados possibilita a implementação do sistema em ambientes diversificados propícios para bin picking, ambientes quais são bastante observado em cenários de indústria, permitindo assim a deteção de diferentes objetos através de modelos específicos Mask-RCNN previamente treinados.Bin picking based on deep learning techniques is a technology that applies a relatively recent concept, utilizing neural networks, intending to enhance the standard bin picking approaches. These approaches are increasingly being applied in bin picking areas due to the potential of deep learning policies to further increase the intelligence and learning capabilities of robots. This dissertation proposes a robust and accurate technique for random bin picking objects, employing an easy configuration to adjust the framework according to the intended object. The framework is implemented in Robot Operating System (ROS) and is divided into a detection and segmentation system, using Mask-RCNN instance segmentation neural network to handle the main detection system, identifying and segmenting several objects from a two dimensions (2D) grayscale image, and point cloud library (PCL) as a basis of the segmentation system, manipulating 3D point cloud data according to the detection results to select particular points of the original point cloud, generating a partial point cloud result. Furthermore, to complete the bin picking system is employed a pose and grasping estimation approach based on matching algorithms, such as Iterative Closest Point (ICP). The detection and segmentation implementation were tested in several datasets for two proposed objects (90º elbow tube and triangular wall support) using a Photoneo PhoXi S 3D scanner (RGB-D sensor), and a desktop computer composed by a Ryzen 5 5600x processor, Gtx 1060 6GB graphic card and 32GB DDR4 of memory, exhibiting high Average precision (Ap), Average recall (Ar), Intersection Over Union (IOU), and F1 score. Executing the full process consumes between 0.53 seconds to 0.85 seconds. The full implementation, including pose and grasping estimation, was tested in a real robot with a UR10 manipulator, a mobile platform and the same RGB-D sensor. The accuracy and capability of detecting objects in several cluttered environments provides the possibility of implementing the system in distinct bin picking environments, as in industry 4.0, allowing to detect of different objects with specific Mask-RCNN trained models, requiring only a neural network training stage to generate these models. The master thesis here presented was conducted under the European Union’s Horizon 2020—The EU Framework Programme for Research and Innovation 2014–2020, under grant agreement No.101006798—Project Mari4 YARD.Silva, Manuel Fernando dos SantosRepositório Científico do Instituto Politécnico do PortoCordeiro, Artur José Vilares2022-11-08T12:35:34Z20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/20989TID:203086457enginfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-03-13T13:16:48Zoai:recipp.ipp.pt:10400.22/20989Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:41:04.683405Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Deep learning for bin picking object segmentation
title Deep learning for bin picking object segmentation
spellingShingle Deep learning for bin picking object segmentation
Cordeiro, Artur José Vilares
Bin picking
Deep learning
Mask-RCNN
Grasping
ROS
Redes neuronais
Inteligência artificial
Artificial Intelligence
Neural networks
title_short Deep learning for bin picking object segmentation
title_full Deep learning for bin picking object segmentation
title_fullStr Deep learning for bin picking object segmentation
title_full_unstemmed Deep learning for bin picking object segmentation
title_sort Deep learning for bin picking object segmentation
author Cordeiro, Artur José Vilares
author_facet Cordeiro, Artur José Vilares
author_role author
dc.contributor.none.fl_str_mv Silva, Manuel Fernando dos Santos
Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv Cordeiro, Artur José Vilares
dc.subject.por.fl_str_mv Bin picking
Deep learning
Mask-RCNN
Grasping
ROS
Redes neuronais
Inteligência artificial
Artificial Intelligence
Neural networks
topic Bin picking
Deep learning
Mask-RCNN
Grasping
ROS
Redes neuronais
Inteligência artificial
Artificial Intelligence
Neural networks
description Bin picking tendo como base técnicas de deep learning é uma tecnologia que adota um conceito recente para melhorar as abordagens padrões utilizando redes neuronais. Estas abordagens estão cada vez mais a ser aplicadas em áreas bin picking devido ao potencial das técnicas de deep learning para melhorar a inteligência e as capacidades de aprendizagem de robôs. Esta dissertação propõe uma técnica robusta e precisa para diversos objectos a granel usados em bin picking, aplicando uma framework com configuração fácil de ajustar de acordo com o objetivo e objetos pretendido. A framework é implementada em Robot Operating System (ROS) e é dividida em dois sistemas, de deteção e segmentação. O sistema de deteção recorre à rede neuronal de segmentação de instâncias Mask-RCNN para estimar as diversas máscaras, identificando e segmentando diversos objetos através de uma imagem de duas dimensões (2D) em tons de cinza. O sistema de segmentação utiliza como base point cloud library (PCL), manipulando informação de 3D point clouds conforme os resultados da deteção para selecionar os pontos específicos da point cloud original, gerando uma point cloud parcial como resultado. Além disso para completar o sistema de bin picking são implementadas abordagens de estimação de posição e localização baseado em algoritmos de correspondência, como Iterative Closest Point (ICP), assim como estimação de grasp. A implementação da deteção e segmentação foi testada em vários datasets para os dois objetos propostos (90º tubo em cotovelo e suporte de parede triangular) utilizando um Photoneo PhoXi S 3D scanner (sensor RGB-D), e um computador composto por um processador Ryzen 5 5600x, placa gráfica Gtx 1060 6GB e memória 32GB DDR4, exibindo uma precisão de 80%, recall de 92.25%, Intersection Over Union (IOU) de 89% e pontuação F1 de 89%. Executando o processo de deteção e segmentação, este consome entre 0.52 segundos e 0.85 segundos. A implementação completa foi realizada num robô industrial com um manipulador UR10, uma plataforma móvel e o mesmo sensor RGB-D, e esta incluí estimação de posição, localização e de ”grasping” para além da framework explicada de deteção e segmentação. A precisão observada e a capacidade de detetar objetos a granel em diversos ambientes desordenados possibilita a implementação do sistema em ambientes diversificados propícios para bin picking, ambientes quais são bastante observado em cenários de indústria, permitindo assim a deteção de diferentes objetos através de modelos específicos Mask-RCNN previamente treinados.
publishDate 2022
dc.date.none.fl_str_mv 2022-11-08T12:35:34Z
2022
2022-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/20989
TID:203086457
url http://hdl.handle.net/10400.22/20989
identifier_str_mv TID:203086457
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131498411982848