Uma equipe de pesquisa liderada pelo professor Hwangbo Jemin, do Departamento de Engenharia Mecânica da KAIST, desenvolveu uma tecnologia de controle de robô quadrúpede que pode andar de forma robusta com agilidade, mesmo em terrenos deformáveis, como uma praia arenosa.
A equipe de pesquisa do professor Hwangbo desenvolveu uma tecnologia para modelar a força recebida por um robô ambulante no chão feito de materiais granulares como areia e a simulou por meio de um robô quadrúpede. Além disso, a equipe trabalhou em uma estrutura de rede neural artificial capaz de tomar decisões em tempo real para se adaptar a vários tipos de superfícies de solo sem informações prévias enquanto caminhava ao mesmo tempo e a aplicou ao aprendizado por reforço.
Espera-se que o controlador de rede neural treinado expanda o alcance dos robôs quadrúpedes, provando sua robustez na mudança de terreno, incluindo a capacidade de se mover em alta velocidade mesmo em uma praia arenosa e caminhar e girar em solos macios como um colchão de ar sem perder Saldo.
Esta pesquisa, com Ph.D. O aluno Soo-Young Choi do Departamento de Engenharia Mecânica KAIST como primeiro autor, foi publicado em janeiro em Ciência Robóticaintitulado “Aprendendo locomoção quadrúpede em terreno deformável”.
O aprendizado por reforço é um método de aprendizado de IA usado para criar uma máquina que coleta dados sobre os resultados de várias ações em uma situação arbitrária e utiliza esse conjunto de dados para executar uma tarefa. Como a quantidade de dados necessária para o aprendizado por reforço é tão vasta, um método de coleta de dados por meio de simulações que aproxima os fenômenos físicos no ambiente real é amplamente utilizado.
Em particular, controladores baseados em aprendizado no campo de robôs ambulantes foram aplicados a ambientes reais após o aprendizado por meio de dados coletados em simulações para executar com sucesso controles de caminhada em vários terrenos.
No entanto, como o desempenho do controlador baseado em aprendizado diminui rapidamente quando o ambiente real apresenta alguma discrepância do ambiente de simulação aprendido, é importante implementar um ambiente semelhante ao real na etapa de coleta de dados. Portanto, para criar um controlador baseado em aprendizado que possa manter o equilíbrio em um terreno deformado, o simulador deve fornecer uma experiência de contato semelhante.
A equipe de pesquisa definiu um modelo de contato que previu a força gerada no contato a partir da dinâmica de movimento de um corpo caminhando com base em um modelo de força de reação do solo que considerou o efeito de massa adicional de meios granulares definidos em estudos anteriores.
Além disso, ao calcular a força gerada a partir de um ou vários contatos em cada intervalo de tempo, o terreno deformado foi simulado com eficiência.
A equipe de pesquisa também introduziu uma estrutura de rede neural artificial que prevê implicitamente as características do solo usando uma rede neural recorrente que analisa dados de séries temporais dos sensores do robô.
O controlador aprendido foi montado no robô RaiBo, que foi construído pela equipe de pesquisa para mostrar uma caminhada em alta velocidade de até 3,03 metros/segundo em uma praia arenosa onde os pés do robô estavam completamente submersos na areia. Mesmo quando aplicado em terrenos mais difíceis, como campos gramados e uma pista de corrida, o RaiBo foi capaz de funcionar de forma estável, adaptando-se às características do solo sem qualquer programação adicional ou revisão do algoritmo de controle.
Além disso, ele girou com estabilidade a 1,54 rad/s (aproximadamente 90° por segundo) em um colchão de ar e demonstrou essa rápida adaptabilidade mesmo na situação em que o terreno repentinamente tornou-se macio.
A equipe de pesquisa demonstrou a importância de fornecer uma experiência de contato adequada durante o processo de aprendizagem em comparação com um controlador que assumiu o solo rígido e provou que a rede neural recorrente proposta modifica o método de caminhada do controlador de acordo com as propriedades do solo.
Espera-se que a metodologia de simulação e aprendizado desenvolvida pela equipe de pesquisa contribua para que os robôs realizem tarefas práticas, pois expande a gama de terrenos em que vários robôs ambulantes podem operar.
O primeiro autor, Suyoung Choi, disse: “Foi demonstrado que fornecer um controlador baseado em aprendizado com uma experiência de contato próximo com o solo deformado real é essencial para a aplicação em terrenos deformantes”. Ele acrescentou que “o controlador proposto pode ser usado sem informações prévias sobre o terreno, portanto pode ser aplicado a vários estudos de caminhada de robôs”.
Mais Informações:
Suyoung Choi et al, Aprendendo locomoção quadrúpede em terreno deformável, Ciência Robótica (2023). DOI: 10.1126/scirobotics.ade2256
Fornecido pelo Instituto Avançado de Ciência e Tecnologia da Coreia (KAIST)
Citação: RaiBo: um cão-robô versátil que corre por uma praia de areia a 3 metros por segundo (2023, 26 de janeiro) recuperado em 26 de janeiro de 2023 em https://techxplore.com/news/2023-01-raibo-versatile-robo- dog-sandy-beach.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.