A otimização de autoaprendizagem do robô aquático aprimora as habilidades de manipulação de objetos subaquáticosReviltec

Um robô aquático com habilidades avançadas de manipulação de objetos subaquáticos — A plataforma de hardware acessível da equipe (US$ 2.000) consiste em 2 câmeras e uma pinça de mandíbula paralela para pesquisa e desenvolvimento de aprendizagem de políticas visuomotoras subaquáticas. Crédito: Liu et al.

Nos últimos anos, os roboticistas introduziram sistemas robóticos que podem completar missões em vários ambientes, desde ambientes terrestres até subterrâneos, acima do solo e subaquáticos. Embora vários desses robôs possam agarrar e mover objetos no solo, o manuseio de objetos por sistemas robóticos subaquáticos tem se mostrado até agora mais desafiador.

Pesquisadores da Universidade de Columbia desenvolveram recentemente o AquaBot, um novo robô subaquático que pode realizar de forma autônoma tarefas básicas de manipulação de objetos debaixo d’água. O robô, apresentado em artigo publicado no arXiv servidor de pré-impressão, combina hardware acessível com um modelo computacional treinado em dados extraídos de demonstrações humanas.

“A manipulação robótica subaquática enfrenta desafios significativos devido à complexa dinâmica de fluidos e ambientes não estruturados, fazendo com que a maioria dos sistemas de manipulação dependam fortemente da teleoperação humana”, escreveram Ruoshi Liu, Huy Ha e seus colegas em seu artigo. “Apresentamos o AquaBot, um sistema de manipulação totalmente autônomo que combina clonagem de comportamento de demonstrações humanas com otimização de autoaprendizagem para melhorar o desempenho da teleoperação humana além do esperado.”

Aquabot, o robô projetado por Liu, Ha e seus colegas, é baseado no drone subaquático QYSEA V-EVO. Os pesquisadores adicionaram uma pinça de mandíbula paralela QYSEA e duas câmeras a este drone aquático, pois isso permitiria coletar imagens relevantes debaixo d’água e concluir tarefas de manipulação de objetos.

Eles também criaram um código que permitiria ao robô aprender de forma autônoma políticas visuomotoras de ponta a ponta, orientando sua manipulação de objetos subaquáticos. Os modelos computacionais que planejam e controlam as ações do robô foram treinados em duas etapas distintas.

“Na primeira fase, destilamos a adaptabilidade humana numa política visuomotora de circuito fechado”, escreveram os investigadores. “Para isso, gravamos demonstrações humanas que teleoperam o robô para realizar diversas tarefas de manipulação e depois usamos os dados para treinar uma política visuomotora. Ao encurtar o horizonte de ação da política, aumentamos efetivamente sua reatividade, o que é fundamental para lidar com situações subaquáticas inesperadas. dinâmica.”

Como parte da segunda etapa de treinamento, Liu, Ha e seus colegas tentaram acelerar o aprendizado de novos comportamentos pelo robô. Para fazer isso, eles usaram a otimização autoguiada, uma abordagem que permite que os sistemas ajustem autonomamente seu processo de aprendizagem usando feedback derivado de suas previsões ou decisões anteriores.

“Nesta etapa, executamos repetidamente a política aprendida e usamos o tempo de execução como recompensa para acelerar a política com um algoritmo de otimização baseado em substituto”, escreveram os pesquisadores. “Esta etapa permite que o sistema otimize ainda mais parâmetros abaixo do ideal (por exemplo, velocidade de execução) nos dados de demonstração humana.”

Os pesquisadores avaliaram o Aquabot em uma série de experimentos no mundo real, testando sua capacidade de completar diferentes tarefas de manipulação de objetos. Essas tarefas incluíam agarrar rochas nunca antes vistas debaixo d’água, separar o lixo em diferentes recipientes e recuperar grandes objetos deformáveis projetados para emular corpos humanos.

O robô teve um bom desempenho em todas essas tarefas, concluindo-as mais rapidamente do que um operador humano faria. Notavelmente, sua abordagem de otimização autoguiada subjacente também permite que o root melhore continuamente sua política básica à medida que ganha mais experiência em ambientes do mundo real.

“Com extensos experimentos no mundo real, demonstramos a versatilidade do AquaBot em diversas tarefas de manipulação, incluindo apreensão de objetos, classificação de lixo e recuperação de resgate”, escreveram Liu, Ha e seus colegas. “Nossos experimentos no mundo real mostram que a política auto-otimizada do AquaBot supera um operador humano em 41% em velocidade. O AquaBot representa um passo promissor em direção a sistemas de manipulação subaquática autônomos e auto-aperfeiçoados.”

O design do hardware e o software utilizados pela equipe de pesquisa são de código aberto e podem ser acessados por outros cientistas da computação em todo o mundo. No futuro, o sistema robótico que desenvolveram poderá ser melhorado, testado em outros experimentos e eventualmente implantado em ambientes naturais para completar diversas missões. Por exemplo, poderia ser utilizado para auxiliar agentes humanos durante missões de busca e salvamento e para recolher lixo, minerais ou outros objetos do fundo do mar.

Mais informações:
Ruoshi Liu et al, Manipulação subaquática autônoma de autoaperfeiçoamento, arXiv (2024). DOI: 10.48550/arxiv.2410.18969

Informações do diário:
arXiv

Citação: A otimização de autoaprendizagem do robô aquático aprimora as habilidades de manipulação de objetos subaquáticos (2024, 6 de novembro) recuperado em 6 de novembro de 2024 em https://techxplore.com/news/2024-11-aquatic-robot-optimization-underwater-skills.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.

Relacionado

Posted by admin

Tagged with

Compartilhe isso:

Relacionado

Posted by admin

Like to share?

Deixe uma respostaCancelar resposta