Algum dia, quando ocorrerem terremotos, incêndios e inundações, os primeiros socorristas poderão ser matilhas de cães de resgate robóticos correndo para ajudar as almas perdidas. Esses quadrúpedes movidos a bateria usariam a visão computacional para avaliar obstáculos e empregariam habilidades de agilidade canina para superá-los.
Para atingir esse nobre objetivo, pesquisadores de IA da Universidade de Stanford e do Instituto Qi Zhi de Xangai dizem ter desenvolvido um novo algoritmo baseado em visão que ajuda cães-robô a escalar objetos altos, saltar através de lacunas, rastejar sob limiares e se espremer através de fendas – e então disparar para o próximo desafio. O algoritmo representa o cérebro do robodog.
“A autonomia e a gama de habilidades complexas que nosso robô quadrúpede aprendeu são bastante impressionantes”, disse Chelsea Finn, professora assistente de ciência da computação e autora sênior de um novo artigo revisado por pares que anuncia a abordagem das equipes ao mundo, que será apresentado na próxima Conferência sobre Aprendizagem de Robôs, realizada de 6 a 9 de novembro em Atlanta. “E nós o criamos usando robôs de baixo custo e prontos para uso – na verdade, dois robôs diferentes prontos para uso.”
O principal avanço, dizem os autores, é que o seu cão-robô é autónomo – isto é, é capaz de avaliar desafios físicos e imaginar, e depois executar, uma ampla gama de habilidades de agilidade baseadas simplesmente nos obstáculos que vê à sua frente.
“O que estamos fazendo é combinar percepção e controle, usando imagens de uma câmera de profundidade montada no robô e aprendizado de máquina para processar todas essas entradas e mover as pernas para passar por cima, por baixo e ao redor de obstáculos”, disse Zipeng. Fu, doutorando no laboratório de Finn e primeiro autor do estudo, juntamente com Ziwen Zhuang do Instituto Qi Zhi de Xangai.
Simplificando para otimizar
O seu cão-robô não é o primeiro a demonstrar tal agilidade – uma classe de atletismo conhecida como “parkour” – mas é o primeiro a combinar autossuficiência com uma ampla gama de habilidades.
“Nossos robôs têm visão e autonomia – a inteligência atlética para avaliar um desafio e para auto-selecionar e executar habilidades de parkour com base nas demandas do momento”, disse Fu.
Os métodos de aprendizagem existentes baseiam-se frequentemente em sistemas de recompensa complexos que devem ser ajustados a obstáculos físicos específicos. Conseqüentemente, eles não se adaptam bem a ambientes novos ou desconhecidos. Outras abordagens relacionadas aprendem a usar dados do mundo real para imitar as habilidades de agilidade de outros animais. Esses robodogs não possuem um amplo conjunto de habilidades e não possuem as capacidades de visão dos novos robodogs. Ambos os métodos existentes também são computacionalmente “lentos” – em outras palavras, lentos.
Este é o primeiro aplicativo de código aberto a atingir esses objetivos com um sistema de recompensa simples, sem usar dados de referência do mundo real, escrevem os autores no estudo.
Para ter sucesso, eles primeiro sintetizaram e aprimoraram o algoritmo usando um modelo de computador e depois o transferiram para dois robôs do mundo real. Em seguida, em um processo chamado aprendizado por reforço, os robôs tentaram avançar da maneira que acharam adequada e foram recompensados com base em seu desempenho. É assim que o algoritmo eventualmente aprende a melhor maneira de abordar um novo desafio.
Na prática, a maioria dos sistemas de recompensa de aprendizagem por reforço existentes envolve muitas variáveis para serem eficazes, retardando o desempenho computacional. Isso é o que torna o processo simplificado de recompensa do robodog parkour excepcional, embora também surpreendentemente simples.
“Na verdade, é bastante simples”, disse Finn. “Baseamos isso principalmente em quão longe o robô está se movendo e na quantidade de esforço que ele aplicou para fazê-lo. Eventualmente, o robô aprende habilidades motoras mais complexas que lhe permitem avançar.”
Testes do mundo real
A equipe então realizou extensos experimentos usando robodogs do mundo real para demonstrar sua nova abordagem de agilidade em ambientes especialmente desafiadores, usando apenas os computadores, sensores visuais e sistemas de energia prontos para uso desses robodogs.
Em números brutos, os novos e melhorados robodogs foram capazes de escalar obstáculos com mais de uma vez e meia a sua altura, saltar lacunas maiores do que uma vez e meia o seu comprimento, rastejar por baixo de barreiras três quartos de sua altura e inclinam-se para passar por uma fenda mais fina que sua largura.
Em seguida, a equipe espera aproveitar os avanços na visão 3D e nos gráficos para adicionar dados do mundo real aos seus ambientes simulados e trazer um novo nível de autonomia do mundo real ao seu algoritmo.
Mais Informações:
Aprendizagem de Parkour de Robô. openreview.net/forum?id=uo937r5eTE
Fornecido pela Universidade de Stanford
Citação: A abordagem de IA produz um cão robótico ‘atleticamente inteligente’ (2023, 5 de outubro) recuperado em 5 de outubro de 2023 em https://techxplore.com/news/2023-10-ai-approach-yields-athleically-intelligent.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.