Roboticistas desenvolveram muitos sistemas avançados ao longo da última década, mas a maioria desses sistemas ainda requer algum grau de supervisão humana. Idealmente, os futuros robôs devem explorar ambientes desconhecidos de forma autônoma e independente, coletando dados continuamente e aprendendo com esses dados.
Pesquisadores da Carnegie Mellon University criaram recentemente o ALAN, um agente robótico que pode explorar de forma autônoma ambientes desconhecidos. Este robô, apresentado num artigo pré-publicado na arXiv e definido para ser apresentado na Conferência Internacional de Robótica e Automação (ICRA 2023), concluiu com sucesso tarefas no mundo real após um breve número de testes de exploração.
“Estávamos interessados em construir uma IA que aprende definindo seus próprios objetivos”, disse Russell Mendonça, um dos pesquisadores que realizou o estudo, ao Tech Xplore. “Ao não depender de humanos para supervisão ou orientação, esses agentes podem continuar aprendendo em novos cenários, movidos por sua própria curiosidade. Isso permitiria a generalização contínua para diferentes domínios e a descoberta de comportamentos cada vez mais complexos.”
O grupo de robótica da Carnegie Mellon University já havia introduzido alguns agentes autônomos que poderiam desempenhar bem novas tarefas com pouco ou nenhum treinamento adicional, incluindo um modelo treinado para jogar o videogame Mario e um sistema que poderia completar tarefas de manipulação de objetos em vários estágios. . No entanto, esses sistemas foram apenas treinados e testados em ambientes simulados.
O principal objetivo do estudo recente da equipe foi criar uma estrutura que pudesse ser aplicada a robôs físicos no mundo, melhorando sua capacidade de explorar seus arredores e concluir novas tarefas. ALAN, o sistema que eles criam, aprende a explorar seu ambiente de forma autônoma, sem receber recompensas ou orientação de agentes humanos. Posteriormente, ele pode reaproveitar o que aprendeu no passado para enfrentar novas tarefas ou problemas.
“A ALAN aprende um modelo de mundo para planejar suas ações e se direciona usando objetivos centrados no ambiente e centrados no agente”, explicou Mendonça. “Também reduz o espaço de trabalho à área de interesse usando detectores pré-treinados prontos para uso. Após a exploração, o robô pode costurar as habilidades descobertas para executar tarefas de estágio único e multiestágio especificadas por meio de imagens de objetivo.”
O robô dos pesquisadores possui um módulo visual que pode estimar os movimentos de objetos ao seu redor. Este módulo então usa essas estimativas de como os objetos se moveram para maximizar a mudança nos objetos e encorajar o robô a interagir com esses objetos.
“Este é um sinal centrado no ambiente, já que não depende da crença do agente”, disse Mendonça. “Para melhorar sua estimativa da mudança de objetos, a ALAN precisa ser curiosa sobre isso. Para isso, a ALAN usa seu modelo de mundo aprendido para identificar ações onde é incerto sobre a mudança de objeto prevista e, em seguida, executa-as no real mundo. Este sinal centrado no agente evolui à medida que o robô vê mais dados.”
Abordagens propostas anteriormente para exploração de robôs autônomos exigiam grandes quantidades de dados de treinamento. Isso impede ou limita significativamente sua implantação em robôs reais. Em contraste, a abordagem de aprendizado proposta por Mendonça e seus colegas permite que o robô ALAN aprenda de forma contínua e autônoma a concluir tarefas à medida que explora seus arredores.
“Mostramos que o ALAN pode aprender a manipular objetos com apenas cerca de 100 trajetórias em 1 a 2 horas em duas cozinhas lúdicas distintas, sem nenhuma recompensa”, disse Mendonça. “Portanto, o uso de prévias visuais pode aumentar muito a eficiência do aprendizado do robô. Versões ampliadas desse sistema, executadas 24 horas por dia, 7 dias por semana, poderão adquirir continuamente novas habilidades úteis com o mínimo de intervenção humana em todos os domínios, aproximando-nos do conhecimento geral. robôs inteligentes de propósito específico.”
Nas avaliações iniciais, o robô da equipe teve um desempenho notável, pois foi capaz de aprender rapidamente a concluir novas tarefas de manipulação sem nenhum treinamento ou ajuda de agentes humanos. No futuro, a ALAN e a estrutura que a sustenta podem abrir caminho para a criação de sistemas robóticos autônomos de melhor desempenho para a exploração do ambiente.
“Em seguida, queremos estudar como utilizar outras prévias para ajudar a estruturar o comportamento do robô, como vídeos de humanos realizando tarefas e descrições de linguagem”, acrescentou Mendonça. “Os sistemas que podem se basear efetivamente nesses dados poderão explorar melhor de forma autônoma, operando em espaços estruturados. Além disso, estamos interessados em sistemas multi-robôs que possam reunir sua experiência para aprender continuamente.”
Mais Informações:
Russell Mendonça et al, ALAN: Autonomamente explorando agentes robóticos no mundo real, arXiv (2023). DOI: 10.48550/arxiv.2302.06604
arXiv
© 2023 Science X Network
Citação: Um robô que pode explorar de forma autônoma ambientes do mundo real (2023, 9 de março) recuperado em 9 de março de 2023 em https://techxplore.com/news/2023-03-robot-autonomously-explore-real-world-environments.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.