Comparação de diferentes esquemas de recompensa em simulações. Crédito: Robótica Científica (2024). DOI: 10.1126/scirobotics.ado5888
Imagine tentar mover um móvel pesado com um grupo de pessoas. O esforço de todos é importante, mas como garantir que cada pessoa esteja fazendo a sua parte? Este desafio de distribuir a carga de forma justa é uma questão crítica não apenas no trabalho em equipe humana, mas também na coordenação de enxames robóticos.
Nas tarefas coletivas, o sucesso do grupo depende da contribuição de cada membro. No entanto, identificar e recompensar os esforços individuais num ambiente coletivo não é pouca coisa. Este desafio torna-se ainda mais assustador quando reduzido ao nível micrométrico, onde enxames de pequenos robôs devem trabalhar juntos para realizar tarefas complexas.
Um novo estudo publicado em Robótica Científicaliderado por Clemens Bechinger, da Universidade de Konstanz, fez progressos significativos na abordagem desta questão. A pesquisa concentra-se em enxames microrobóticos – pequenos robôs impulsionados por pontos de laser – e na dificuldade de atribuir crédito a cada robô por seu papel em uma tarefa de grupo. Sem um sistema justo para o fazer, alguns robôs podem afrouxar enquanto outros suportam o fardo, prejudicando assim o desempenho global do enxame.
Para resolver isso, os pesquisadores empregaram um algoritmo de aprendizado de máquina juntamente com um método especial para estimar a contribuição de cada microrobô. Este método garante que o esforço de cada robô seja reconhecido e otimizado, evitando o “problema do agente preguiçoso” que pode afetar as tarefas coletivas.
“Esta pesquisa foi incrivelmente desafiadora devido à imprevisibilidade em escalas tão pequenas. Mas, ao usar recompensas contrafactuais, fomos capazes de controlar com precisão o comportamento de cada microrobô e garantir que todo o enxame funcionasse em conjunto de forma eficiente”, disse Veit-Lorenz Heuthe, pesquisador de doutorado na o Cluster of Excellence Collective Behavior, que conduziu os experimentos.
Essas “recompensas contrafactuais” dão crédito a cada microrobô por sua contribuição e, assim, fornecem ao enxame indicadores para aprender como fazer uma melhor distribuição de forças por conta própria.
“Nossas descobertas mostram que mesmo em um enxame de pequenos robôs, é crucial reconhecer e otimizar as contribuições individuais para alcançar os melhores resultados”, disse Bechinger, líder do grupo de pesquisa e investigador principal do Cluster of Excellence Collective Behavior. “Esta abordagem não só aumenta a eficiência dos enxames microrobóticos, mas também fornece insights para melhorar o trabalho em equipe em qualquer sistema coletivo.”
Esta pesquisa abre novas possibilidades para o uso de enxames microrobóticos em áreas como medicina e monitoramento ambiental, onde o controle e a coordenação precisos são essenciais.
Veit-Lorenz Heuthe et al, Recompensas contrafactuais promovem o transporte coletivo usando microrobôs de enxame controlados individualmente, Robótica Científica (2024). DOI: 10.1126/scirobotics.ado5888
Fornecido pela Universidade de Constança
Citação: Microrobôs e o ‘problema do agente preguiçoso’: estudo Swarm demonstra uma solução (2024, 19 de dezembro) recuperado em 19 de dezembro de 2024 em https://techxplore.com/news/2024-12-microrobots-lazy-agent-problem-swarm. HTML
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.