Os humanos são criaturas sociais e aprendem uns com os outros, mesmo desde tenra idade. Os bebês observam atentamente seus pais, irmãos ou cuidadores. Eles assistem, imitam e reproduzem o que veem para aprender habilidades e comportamentos.
A forma como os bebés aprendem e exploram o ambiente que os rodeia inspirou investigadores da Carnegie Mellon University e da Meta a desenvolver uma nova forma de ensinar aos robôs como aprender simultaneamente múltiplas competências e aproveitá-las para enfrentar tarefas quotidianas invisíveis. Os pesquisadores decidiram desenvolver um agente robótico de IA com habilidades de manipulação equivalentes às de uma criança de 3 anos.
A equipe anunciou o RoboAgent, um agente de inteligência artificial que aproveita observações passivas e aprendizado ativo para permitir que um robô adquira habilidades de manipulação equivalentes às de uma criança pequena.
“RoboAgent é um marco crítico para agentes robóticos gerais que são alunos eficientes, eficazes em situações novas e capazes de expandir seus comportamentos ao longo do tempo”, disse Vikash Kumar, professor adjunto do Instituto de Robótica da Escola de Ciência da Computação.
“Os robôs atuais são altamente especializados e treinados para tarefas individuais isoladamente. Em contraste, pretendemos criar um único agente de inteligência artificial capaz de exibir uma ampla gama de habilidades em cenários invisíveis. O RoboAgent aprende como bebês humanos – aproveitando uma combinação de recursos abundantes. observações passivas e jogo ativo limitado.”
RoboAgent pode completar 12 habilidades de manipulação em diferentes cenas. Esta pesquisa aponta para uma plataforma de aprendizagem robótica adaptável a ambientes em mudança. Ao contrário de pesquisas anteriores, a equipe demonstrou seu trabalho em ambientes reais – não em simulação – e o fez com muito menos dados do que projetos anteriores.
“Os RoboAgents são capazes de uma complexidade de habilidades muito mais rica do que outros alcançaram”, disse Abhinav Gupta, professor associado do Instituto de Robótica. “Mostramos uma maior diversidade de habilidades do que qualquer coisa já alcançada por um único agente robótico do mundo real com eficiência e uma escala de generalização para cenários invisíveis que é única”.
O agente da equipe aprende por meio de uma combinação de experiências próprias e observações passivas contidas em dados da Internet. Como um pai guiaria seu filho, os pesquisadores teleoperaram o robô através de tarefas para proporcionar-lhe experiências pessoais úteis.
“A eficácia e a eficiência da nossa abordagem decorrem da nossa nova arquitetura política que permite aos nossos agentes raciocinar mesmo com experiências limitadas”, disse Homanga Bharadwaj, Ph.D. estudante de robótica. “O RoboAgent atua em resposta a objetivos textuais/visuais específicos, prevendo e agregando decisões em termos de blocos temporais de movimentos, em vez de ações comumente usadas por passo de tempo.”
Os robôs aprendem principalmente com suas próprias experiências, e não com o que acontece passivamente ao seu redor. Esta cegueira inerente ao que se passa no seu ambiente limita fundamentalmente a diversidade de experiências a que os robôs estão expostos e as suas capacidades de adaptação a novas situações. Para superar essas limitações, o RoboAgent aprende com vídeos na internet – semelhante à forma como os bebês adquirem conhecimentos e comportamentos observando passivamente o que os rodeia.
“O RoboAgent aproveita as informações contidas nesses vídeos para aprender previamente sobre como os humanos interagem com os objetos e usam várias habilidades para concluir tarefas com sucesso”, disse Mohit Sharma, Ph.D. estudante de robótica. “Além disso, observar habilidades semelhantes em vários cenários permite aprender o que é e o que não é necessário para concluir uma tarefa. Ele aproveita essas lições quando se depara com tarefas desconhecidas ou ambientes invisíveis.”
“Um agente capaz deste tipo de aprendizagem nos aproxima de um robô geral que pode completar uma variedade de tarefas em diversos ambientes invisíveis e evoluir continuamente à medida que reúne mais experiências”, disse Shubham Tulsiani, professor assistente no Instituto de Robótica. “O RoboAgent pode treinar rapidamente um robô usando dados limitados no domínio, ao mesmo tempo em que depende principalmente de dados gratuitos abundantemente disponíveis na Internet para aprender uma variedade de tarefas. Isso pode tornar os robôs mais úteis em ambientes não estruturados, como residências, hospitais e outros espaços públicos.”
A equipe está abrindo o código-fonte de seus modelos treinados, base de código, drivers de hardware e, mais notavelmente, todo o conjunto de dados coletados nesta pesquisa. RoboSet é o maior conjunto de dados de robótica disponível publicamente em hardware comum. A equipe espera que isso permita que outros o reutilizem, adaptem e transmitam, levando a um agente robótico geral verdadeiramente fundamental ao longo do tempo.
Mais Informações:
Mais informações sobre RoboAgent e RoboSet estão disponíveis no site do projeto.
Fornecido pela Universidade Carnegie Mellon
Citação: Ser pai de um robô de 3 anos (2023, 8 de agosto) recuperado em 22 de agosto de 2023 em https://techxplore.com/news/2023-08-parenting-year-old-robot.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.