Um dos destaques aqui é a capacidade do Atlas de se mover e interagir dinamicamente com objetos e, especialmente, com objetos que possuem massa significativa. O 180 enquanto segura a trave é impressionante, já que Atlas tem que dar conta de todo esse impulso adicional. O mesmo acontece com o arremesso do saco giratório: assim que o robô solta o saco no ar, seu momento muda, o que ele deve compensar na aterrissagem. E empurrar aquela caixa tem que ser feito inclinando-se para ela, mas com cuidado, para que Atlas não caia da plataforma depois dela.
Embora as capacidades físicas que o Atlas demonstra aqui sejam impressionantes (para dizer o mínimo), essa demonstração também destaca quanto trabalho ainda precisa ser feito para ensinar os robôs a serem úteis dessa maneira de maneira autônoma ou mesmo semiautônoma. Por exemplo, a modificação ambiental é algo que os humanos fazem o tempo todo, mas dependemos fortemente de nosso conhecimento do mundo para fazê-lo de forma eficaz. Tenho certeza de que o Atlas não tem a capacidade de ver uma lacuna não atravessável, considerar que tipo de modificação seria necessária para tornar a lacuna atravessável, localizar os recursos necessários (sem ser informado onde eles estão primeiro) e em seguida, faça a modificação apropriada de forma autônoma, da mesma forma que um humano faria – o vídeo mostra avanços na manipulação, em vez de na tomada de decisões. Isso certamente não é uma crítica ao que o Boston Dynamics está mostrando neste vídeo, é apenas para enfatizar que ainda há muito trabalho a ser feito no lado da compreensão e raciocínio do mundo antes que os robôs sejam capazes de alavancar essas impressionantes habilidades físicas em seus próprios de maneira produtiva.
Há muito mais acontecendo neste vídeo, e o Boston Dynamics preparou uma explicação útil dos bastidores:
E para saber um pouco mais sobre isso, enviamos algumas perguntas para o Boston Dynamics, e o líder da equipe Atlas, Scott Kuindersma, teve a gentileza de respondê-las para nós.
Quanto o Atlas sabe com antecedência sobre os objetos que estará manipulando e qual a importância desse conhecimento para a manipulação do mundo real?
Scott Kuindersma: Neste vídeo, o robô tem um mapa de alto nível que inclui onde queremos que ele vá, o que queremos que ele pegue e quais acrobacias ele deve fazer ao longo do caminho. Este mapa não é uma correspondência geométrica exata para o ambiente real; é uma descrição aproximada contendo modelos de obstáculos e ações anotadas que são adaptadas online pelo sistema de percepção do robô. O robô tem alvos de alcance relativos ao objeto que foram calculados offline, e o controlador preditivo de modelo (MPC) tem acesso a propriedades de massa aproximadas.
Achamos que os robôs do mundo real também aproveitarão as prévias sobre suas tarefas e ambientes, mas a forma que essas priorizações assumem e a quantidade de informações que fornecem pode variar muito com base no aplicativo. Os requisitos para um vídeo como este levam naturalmente a um conjunto de escolhas – e talvez alguns desses requisitos se alinhem com alguns dos primeiros aplicativos comerciais – mas também estamos desenvolvendo recursos que permitem que o Atlas opere em outros pontos desse espectro.
Com que frequência o que você deseja fazer com o Atlas é limitado por seus recursos de hardware? Neste ponto, quanta diferença faz a melhoria do hardware em relação à melhoria do software?
Kuindersma: Não com frequência. Quando ocasionalmente gastamos tempo em algo como o 540 invertido, estamos intencionalmente ultrapassando os limites e chegando a ele a partir de um lugar de exploração lúdica. Além de serem muito divertidos para nós e (espero) inspiradores para os outros, essas atividades quase sempre trazem frutos duradouros e nos deixam com softwares mais capazes de abordar outros problemas.
A forte integração entre nossos grupos de hardware e software — e nossa capacidade de projetar, iterar e aprender uns com os outros — é uma das coisas que torna nossa equipe especial. Ocasionalmente, isso leva a atualizações de hardware que habilitam o comportamento e, com menos frequência, a redesenhos importantes. Mas, de uma perspectiva de software, sentimos continuamente que estamos apenas arranhando a superfície do que podemos fazer com o Atlas.
Você pode detalhar o processo de solução de problemas usado para garantir que o Atlas pudesse executar com êxito o truque final?
Kuindersma: O controlador funciona usando um modelo do robô para prever e otimizar seus estados futuros. A melhoria feita neste caso foi uma extensão deste modelo para incluir a forma geométrica dos membros do robô e restrições para evitar que eles se cruzem. Em outras palavras, em vez de ajustar especificamente esse comportamento para evitar autocolisões, adicionamos mais detalhes do modelo ao controlador para permitir que ele evite configurações inviáveis. Dessa forma, os benefícios se estendem a todos os comportamentos da Atlas.
O pequeno salto no final do 540 faz parte da sequência planejada ou o Atlas é capaz de usar movimentos como esse de forma autônoma para se recuperar de comportamentos dinâmicos que não terminam exatamente como o esperado? Qual será a importância desse tipo de capacidade para os robôs do mundo real?
Kuindersma: O robô tem a capacidade de dar passos de forma autônoma, inclinar-se e/ou balançar seus membros para recuperar o equilíbrio, que utilizamos praticamente diariamente em nosso trabalho experimental. O pulo após o 540 invertido fazia parte da sequência de comportamento no sentido de que era dito que ele deveria pular após o pouso, mas para onde saltava e como aterrissava vinha do controlador (e geralmente variava entre robôs e corridas individuais) .
Nossa experiência com a implantação do Spot em todo o mundo reforçou a importância de os robôs móveis serem capazes de se ajustar e se recuperar caso sofram choques, escorreguem, caiam ou encontrem obstáculos inesperados. Esperamos que o mesmo seja verdade para futuros robôs trabalhando no mundo real.
O que mais você pode compartilhar conosco sobre o que foi feito para fazer o vídeo?
Kuindersma: Algumas curiosidades:
As novas tecnologias centrais em torno do MPC e da manipulação foram desenvolvidas ao longo deste ano, mas o tempo entre nosso esboço no quadro branco para o vídeo e a conclusão da filmagem foi de 6 semanas.
O arremesso da bolsa de ferramentas e o salto giratório com a prancha de 2 por 12 polegadas são generalizações on-line do mesmo comportamento de salto de 180 que foi criado há dois anos como parte de nosso trabalho de mobilidade. As únicas diferenças nas entradas do controlador são o modelo do objeto e o movimento do objeto desejado.
Embora o robô tenha uma boa compreensão da mecânica de arremesso, o desempenho no mundo real foi sensível ao momento preciso do lançamento e se o pano do saco ficou preso no dedo durante o lançamento. Esses detalhes não foram bem representados por nossas ferramentas de simulação, então contamos principalmente com experimentos de hardware para refinar o comportamento até que funcionasse sempre.
Artigos Relacionados na Web