Dominando o contato físico com novo algoritmo para robôs

Tocando o futuro: Dominando o contato físico com novo algoritmo para robôs

Crédito: Laboratório DAIR

A Penn Engineers desenvolveu um novo algoritmo que permite que robôs reajam a contatos físicos complexos em tempo real, possibilitando que robôs autônomos tenham sucesso em tarefas anteriormente impossíveis, como controlar o movimento de um objeto deslizante.

O algoritmo, conhecido como controle de complementaridade de consenso (C3), pode provar ser um elemento essencial para futuros robôs, traduzindo as instruções dos resultados de ferramentas de inteligência artificial, como grandes modelos de linguagem, ou LLMs, em ações apropriadas.

“Seu grande modelo de linguagem pode dizer: ‘Vá picar uma cebola'”, diz Michael Posa, professor assistente em Engenharia Mecânica e Mecânica Aplicada (MEAM) e membro principal do corpo docente do Laboratório Geral de Robótica, Automação, Sensoriamento e Percepção (GRASP) . “Como você move o braço para segurar a cebola no lugar, para segurar a faca, para cortá-la da maneira certa, para reorientá-la quando necessário?”

Um dos maiores desafios da robótica é o controle, um termo abrangente para o uso inteligente dos atuadores do robô, as partes de um robô que movem ou controlam seus membros, como motores ou sistemas hidráulicos. O controle do contato físico que um robô faz com o seu entorno é difícil e essencial.

“Esse tipo de raciocínio de nível inferior e médio é realmente fundamental para fazer qualquer coisa funcionar no mundo físico”, diz Posa.







O novo algoritmo permite que o braço robótico equilibre e mova a bandeja plástica do garçom, dominando o controle de um objeto deslizante – uma tarefa anteriormente impossível para os robôs. Crédito: Laboratório DAIR

Desde a década de 1980, os especialistas em inteligência artificial reconheceram que, paradoxalmente, as primeiras competências que os humanos aprendem – como manipular objetos e mover-se de um lugar para outro, mesmo diante de obstáculos – são as mais difíceis de ensinar aos robôs, e vice-versa.

“Os robôs funcionam muito bem até começarem a tocar nas coisas”, diz Posa. “As máquinas de inteligência artificial agora podem resolver problemas de matemática no nível das Olimpíadas Internacionais de Matemática e vencer especialistas no xadrez. Mas elas têm as capacidades físicas de uma criança de 2 ou 3 anos, na melhor das hipóteses.”

Em essência, isso significa que toda interação que os robôs têm que envolva tocar algo – pegar um objeto, movê-lo para outro lugar – deve ser cuidadosamente coreografada. “O principal desafio é a sequência de contato”, diz William Yang, recém-graduado pelo Laboratório de Autonomia Dinâmica e Robótica Inteligente (DAIR) da Posa. “Onde você coloca a mão no meio ambiente? Onde você coloca o pé no meio ambiente?”

Os humanos, é claro, raramente precisam pensar duas vezes sobre como interagem com os objetos. Em parte, o desafio para os robôs é que algo tão simples como pegar uma xícara envolve, na verdade, muitas escolhas diferentes – desde o ângulo correto de abordagem até a quantidade apropriada de força.







Um vislumbre do processo do algoritmo, que permite aos robôs “alucinar” o estado futuro dos objetos, permitindo-lhes reagir ao contato físico em tempo real. Crédito: Laboratório DAIR

“Nem todas essas escolhas são tão diferentes daquelas que as cercam”, ressalta Posa. Mas, até agora, nenhum algoritmo permitiu que os robôs avaliassem todas essas escolhas e tomassem uma decisão apropriada em tempo real.

Para resolver o problema, os investigadores criaram essencialmente uma forma de ajudar os robôs a “alucinar” as diferentes possibilidades que podem surgir ao fazer contacto com um objeto. “Ao imaginar os benefícios de tocar nas coisas, você obtém gradientes em seu algoritmo que correspondem a essa interação”, diz Posa.

“E então você pode aplicar algum estilo de algoritmo baseado em gradiente e no processo de resolução que problema, a física gradualmente se torna cada vez mais precisa ao longo do tempo, até onde você não está apenas imaginando: ‘E se eu tocar nela?’ mas você está realmente planejando sair e tocá-lo.”

No ano passado, Posa e o DAIR Lab escreveram um conjunto de artigos premiados sobre o tema, mais recentemente um postado no arXiv servidor de pré-impressão do qual Yang atuou como autor principal, que ganhou o Outstanding Student Paper Award na conferência 2024 Robotics: Science and Systems na Holanda.

Tocando o futuro: Dominando o contato físico com novo algoritmo para robôs

Crédito: Laboratório DAIR

Esse artigo demonstra como o C3 pode capacitar robôs para controlar objetos deslizantes em tempo real. “Deslizar é notoriamente difícil de controlar na robótica”, diz Yang. “Matematicamente, é difícil, mas você também precisa confiar no feedback do objeto.”

Mas, usando C3, Yang demonstrou como um braço robótico pode manipular uma bandeja com segurança, semelhante ao que os garçons podem usar em um restaurante. Em experimentos gravados em vídeo, Yang fez com que o braço robótico pegasse a bandeja e a colocasse no chão, com e sem uma xícara de café, e girasse a bandeja contra a parede. “Trabalho anterior pensava: ‘Queremos apenas evitar o deslizamento'”, diz Yang, “mas o algoritmo inclui o deslizamento como uma possibilidade a ser considerada pelos robôs.”

No futuro, Posa e seu grupo esperam tornar o algoritmo ainda mais robusto para diferentes situações, como quando os objetos que um robô manuseia pesam um pouco mais ou menos do que o previsto, e estender o projeto para cenários mais abertos que o C3 atualmente não consegue lidar.

“Este é um bloco de construção que pode ir de uma especificação bastante simples – fazer essa peça ir até lá – e destilar isso até o torque do motor que o robô precisará para conseguir isso”, diz Posa. “Indo de um mundo muito, muito complicado e confuso até os principais conjuntos de objetos, recursos ou propriedades dinâmicas que importam para qualquer tarefa, essa é a questão em aberto na qual estamos interessados.”

Mais informações:
William Yang et al, Manipulação dinâmica na palma da mão via deslizamento controlado, arXiv (2024). DOI: 10.48550/arxiv.2405.08731

Informações do diário:
arXiv

Fornecido pela Universidade da Pensilvânia

Citação: Tocando o futuro: dominando o contato físico com novo algoritmo para robôs (2024, 15 de outubro) recuperado em 15 de outubro de 2024 em https://techxplore.com/news/2024-10-future-mastering-physical-contact-algorithm.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.



Deixe uma resposta