Há duas partes neste problema: a primeira é ter dedos que podem funcionar como dedos humanos (ou tão próximos dos dedos humanos quanto é razoável esperar); a segunda é ter a inteligência necessária para fazer algo útil com esses dedos.
“Assim que adicionarmos feedback visual à mistura junto com o toque, esperamos ser capazes de obter ainda mais destreza e um dia começar a abordar a replicação da mão humana.”
–Matei Ciocarlie, Colômbia:
Em um artigo recém-aceito para a conferência Robotics: Science and Systems 2023, pesquisadores da Universidade de Columbia mostraram como treinar dedos robóticos para realizar manipulação hábil de objetos complexos sem deixá-los cair. Além do mais, a manipulação é feita inteiramente pelo toque, sem necessidade de visão.
Dedos robóticos manipulam objetos aleatórios¸ – um nível de destreza que os humanos dominam quando são crianças.Universidade Columbia
Esses dedos levemente grossos têm muita coisa acontecendo dentro deles para ajudar a tornar esse tipo de manipulação possível. Debaixo da pele de cada dedo há uma membrana refletora flexível, e sob essa membrana há uma matriz de LEDs junto com uma matriz de fotodiodos. Cada LED é ligado e desligado por uma fração de milissegundo, e os fotodiodos registram como a luz de cada LED reflete na membrana interna do dedo. O padrão dessa reflexão muda quando a membrana se flexiona, o que acontece se o dedo estiver em contato com alguma coisa. Um modelo treinado pode correlacionar esse padrão de luz com a localização e a amplitude dos contatos dos dedos.
Então, agora que você tem dedos que sabem o que estão tocando, eles também precisam saber como tocar em algo para manipulá-lo da maneira que você deseja, sem deixá-lo cair. Existem alguns objetos que são amigáveis ao robô quando se trata de manipulação, e alguns que são hostis ao robô, como objetos com formas e concavidades complexas (formas de “L” ou “U”, por exemplo). E com um número limitado de dedos, fazer a manipulação com as mãos muitas vezes não garante que o objeto permaneça em uma pegada estável. Esta é uma habilidade chamada “andar com os dedos” e requer prática. Ou, neste caso, é preciso aprendizado por reforço (que, eu acho, é indiscutivelmente a mesma coisa). O truque que os pesquisadores usam é combinar métodos baseados em amostragem (que encontram trajetórias entre estados iniciais e finais conhecidos) com aprendizado por reforço para desenvolver uma política de controle treinada em todo o espaço de estados.
Embora esse método funcione bem, toda essa coisa de não visão é uma espécie de restrição artificial. Isso não quer dizer que a capacidade de manipular objetos no escuro ou na desordem não seja super importante, é apenas que há ainda mais potencial com a visão, diz Matei Ciocarlie, da Columbia: “Uma vez que também adicionamos feedback visual à mistura junto com o toque , esperamos poder alcançar ainda mais destreza e um dia começar a nos aproximar da replicação da mão humana.”
Exploração baseada em amostragem para aprendizado por reforço de manipulação hábilde Gagan Khandate, Siqi Shang, Eric T. Chang, Tristan Luca Saidi, Johnson Adams e Matei Ciocarlie da Columbia University, é aceito no RSS 2023.
Artigos Relacionados na Web