O diagrama do método de aprendizagem por reforço profundo para habilidades de apreensão e operação de montagem de robôs. Crédito: O Jornal Internacional de Tecnologia de Fabricação Avançada (2024). DOI: 10.1007/s00170-024-13004-0
Robôs semiautônomos e autônomos estão sendo introduzidos em um número crescente de ambientes do mundo real, incluindo ambientes industriais. Os robôs industriais poderiam acelerar a fabricação de vários produtos, auxiliando os trabalhadores humanos em tarefas básicas e aliviando sua carga de trabalho.
Duas das tarefas mais cruciais na fabricação são a captura de objetos e a montagem de produtos, mas lidar com essas tarefas de maneira confiável usando sistemas robóticos pode ser um desafio. Uma das principais limitações dos robôs industriais para cadeias de montagem automatizadas é que eles precisam ser extensivamente programados para realizar tarefas específicas (por exemplo, agarrar e montar itens específicos), e sua programação específica do produto pode levar tempo.
Pesquisadores da Universidade de Tecnologia de Qingdao decidiram recentemente resolver esta limitação crucial dos robôs industriais usando aprendizagem por reforço profundo. Seu artigo, publicado em O Jornal Internacional de Tecnologia de Fabricação Avançadaapresenta novos algoritmos de aprendizagem profunda que podem acelerar o tempo necessário para treinar robôs industriais em novas tarefas de apreensão e montagem.
“Este artigo propõe uma estrutura baseada em aprendizagem por reforço profundo para aprendizagem de habilidades de montagem e apreensão autônoma de robôs”, escreveram Chengjun Chen, Hao Zhang e seus colegas em seu artigo.
“Enquanto isso, são apresentados um algoritmo de aprendizagem de habilidades de apreensão de robôs baseado em Q-learning profundo e um algoritmo de aprendizagem de habilidades de montagem de robôs baseado em PPO, onde informações de conhecimento a priori são introduzidas para otimizar a ação de apreensão e reduzir o tempo de treinamento e os dados de interação necessários por o algoritmo de aprendizagem da estratégia de montagem.”
As novas técnicas para treinamento de robôs apresentadas neste artigo recente baseiam-se em ferramentas de visão computacional e aprendizado de máquina introduzidas nos últimos anos. Primeiro, os pesquisadores desenvolveram um algoritmo de aprendizagem profunda projetado para ensinar rapidamente aos robôs novas habilidades de compreensão de objetos, bem como um algoritmo separado para treinar robôs para montar objetos específicos.
Ao mesmo tempo, eles também projetaram funções de recompensa que podem ser usadas para avaliar com eficácia as habilidades de preensão e montagem de sistemas robóticos industriais. Isso inclui funções de recompensa de restrição de apreensão e montagem.
Para avaliar o potencial da caixa de ferramentas de treinamento de robôs proposta, Chen, Zhang e seus colegas testaram-na em simulações e em robôs industriais físicos. Em seus experimentos no mundo real, a equipe usou especificamente o UR5, um braço robótico leve frequentemente aplicado em tarefas industriais, juntamente com uma câmera RealSense D435i para coletar imagens RGB de objetos, que seus algoritmos poderiam então analisar.
“A eficácia da estrutura e dos algoritmos propostos foi verificada em ambientes simulados e reais, e a taxa média de sucesso de preensão em ambos os ambientes foi de até 90%. Sob uma tolerância de montagem peg-in-hole de 3 mm, o sucesso da montagem a taxa foi de 86,7% e 73,3% no ambiente simulado e no ambiente físico, respectivamente”, escreveram os pesquisadores em seu artigo.
Os resultados iniciais coletados por Chen, Zhang e seus colaboradores são muito promissores, sugerindo que seu kit de ferramentas de algoritmo de treinamento poderia acelerar a programação de robôs industriais, ensinando-os rapidamente a agarrar e montar objetos de maneira confiável. Nos seus próximos estudos, os investigadores planeiam melhorar ainda mais a sua abordagem e continuar a testá-la em tarefas comuns de apreensão e montagem.
“Em trabalhos futuros, melhoraremos a precisão da detecção de furos e a randomização de domínio da forma e imagem dos furos no ambiente virtual, otimizaremos a estratégia do ambiente de simulação para o ambiente físico e reduziremos erros em ambas as etapas para melhorar a montagem taxa de sucesso no ambiente físico”, concluíram os pesquisadores.
Mais Informações:
Chengjun Chen et al, Aprendizagem autônoma de habilidades de apreensão e montagem de robôs com base na aprendizagem por reforço profundo, O Jornal Internacional de Tecnologia de Fabricação Avançada (2024). DOI: 10.1007/s00170-024-13004-0
© 2024 Science X Network
Citação: Uma abordagem de aprendizagem por reforço profundo para aprimorar a apreensão e montagem robótica autônoma (2024, 6 de fevereiro) recuperada em 6 de fevereiro de 2024 em https://techxplore.com/news/2024-02-deep-approach-autonomous-robotic-grasping.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.