Esquema de um fluxo completo para atingir a montagem colaborativa de móveis. Este trabalho foca nos componentes destacados em vermelho. Crédito: arXiv (2024). DOI: 10.48550/arxiv.2408.16125
Garantir que robôs possam colaborar suavemente com humanos em ambientes do mundo real é um passo crucial para sua implantação em larga escala. Enquanto alguns sistemas robóticos já estão interagindo diariamente com agentes humanos, por exemplo, em instalações industriais e de manufatura parcialmente automatizadas, a colaboração humano-robô em tarefas cotidianas continua escassa.
Pesquisadores da Universidade de Padova e dos Laboratórios de Pesquisa Mitsubishi Electric (MERL) em Cambridge desenvolveram uma estrutura que ajuda a planejar tarefas que envolvem colaboração humano-robô. Esta estrutura, introduzida em um artigo pré-publicado no arXiv servidor, foca especificamente em tarefas que envolvem a montagem colaborativa de sistemas complexos com vários componentes subjacentes, como peças de mobiliário.
Os pesquisadores chamaram sua estrutura de DECAF, que significa Discrete-Event based Collaborative Human-Robot Assembly Framework para móveis. DECAF tem vários componentes subjacentes, incluindo um modelo de processo de decisão de Markov de evento discreto (DE-MDP), uma descrição HTM do processo de montagem e um módulo de interferência bayesiano.
“O humano é caracterizado como um agente incontrolável, o que implica, por exemplo, que o agente não está vinculado a uma sequência pré-estabelecida de ações e, em vez disso, age de acordo com suas próprias preferências”, escreveram Giulio Giacomuzzo, Matteo Terreran e seus colegas em seu artigo. “Enquanto isso, o planejador de tarefas calcula reativamente as ações ótimas para o robô colaborativo concluir eficientemente toda a tarefa de montagem no menor tempo possível.”
Com a estrutura recém-desenvolvida, o processo de montagem colaborativa abrange várias etapas. Primeiramente, o robô observa as ações realizadas pelo agente humano, por meio de uma câmera ou outros sensores.
Com base nessas observações, o modelo DECAF planeja ações para o robô que maximizariam a eficiência da equipe robô-humano na conclusão das tarefas de montagem em questão, ao mesmo tempo em que adapta essas ações após eventos imprevisíveis. A equipe modelou a montagem de móveis ou outros objetos utilizando uma estrutura matemática frequentemente usada para enquadrar processos específicos de tomada de decisão, conhecida como DE-MDP.
“Formalizamos o problema como DE-MDP, uma estrutura abrangente que incorpora uma variedade de comportamentos assíncronos, mudança de mentalidade humana e recuperação de falhas como eventos estocásticos”, escreveram Giacomuzzo, Terreran e seus colegas.
“Embora o problema pudesse teoricamente ser abordado construindo um gráfico de todas as ações possíveis, tal abordagem seria restringida por limitações computacionais. A formulação proposta oferece uma solução alternativa utilizando Reinforcement Learning para derivar uma política ótima para o robô.”
Essencialmente, o modelo DE-MDP é usado para decompor uma tarefa de montagem e identificar ações ótimas que permitiriam ao robô lidar eficientemente em colaboração com um agente humano. O segundo componente da estrutura DECAF, ou seja, o modelo HTM, codifica a interdependência entre várias subtarefas, facilitando assim o processo de planejamento.
Por fim, a equipe integrou um módulo baseado em uma abordagem estatística conhecida como interferência bayesiana, que é tipicamente usada para atualizar continuamente a probabilidade de que uma dada hipótese seja verdadeira conforme mais informações se tornam disponíveis. Este módulo permite que a estrutura monitore as ações do agente humano e as use para prever as intenções de um agente humano.
Os pesquisadores avaliaram o DECAF em uma série de testes e executaram tanto em simulação quanto em um cenário do mundo real. Para o experimento real, 10 participantes adultos foram solicitados a montar uma cadeira comprada da IKEA em colaboração com um manipulador robótico de 7-DoF (ou seja, o braço Franka Emika Panda).
As descobertas dos testes iniciais executados pela equipe foram altamente promissoras. Em simulações, descobriu-se que a estrutura DECAF superou as políticas de planejamento padrão, enquanto durante os experimentos do mundo real pareceu melhorar a eficiência e a qualidade da colaboração humano-robô.
“No futuro, planejamos incluir outras métricas ótimas além do tempo de execução, como segurança humana, correlação de ações e ergonomia humana”, escreveram os pesquisadores.
Giulio Giacomuzzo et al, DECAF: uma estrutura colaborativa humano-robô baseada em eventos discretos para montagem de móveis, arXiv (2024). DOI: 10.48550/arxiv.2408.16125
arXiv
© 2024 Rede Ciência X
Citação: Estrutura de planejamento de tarefas oferece suporte à montagem colaborativa de móveis entre humanos e robôs (2024, 17 de setembro) recuperado em 17 de setembro de 2024 de https://techxplore.com/news/2024-09-task-framework-human-robot-collaborative.html
Este documento está sujeito a direitos autorais. Além de qualquer uso justo para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.