Qualquer pessoa que já tenha tentado colocar uma bagagem tamanho família em um porta-malas do tamanho de um sedã sabe que esse é um problema difícil. Os robôs também enfrentam tarefas densas de embalagem.
Para o robô, resolver o problema da embalagem envolve satisfazer muitas restrições, como empilhar a bagagem para que as malas não caiam do porta-malas, objetos pesados não sejam colocados em cima dos mais leves e colisões entre o braço robótico e o para-choque do carro. são evitados.
Alguns métodos tradicionais abordam esse problema sequencialmente, adivinhando uma solução parcial que atenda a uma restrição por vez e depois verificando se alguma outra restrição foi violada. Com uma longa sequência de ações a serem tomadas e uma pilha de bagagem para embalar, esse processo pode ser impraticavelmente demorado.
Os pesquisadores do MIT usaram uma forma de IA generativa, chamada modelo de difusão, para resolver esse problema de forma mais eficiente. Seu método, descrito em um artigo postado no arXiv servidor de pré-impressão, usa uma coleção de modelos de aprendizado de máquina, cada um dos quais é treinado para representar um tipo específico de restrição. Esses modelos são combinados para gerar soluções globais para o problema de empacotamento, levando em consideração todas as restrições de uma só vez.
Seu método foi capaz de gerar soluções eficazes mais rapidamente do que outras técnicas e produziu um número maior de soluções bem-sucedidas no mesmo período de tempo. É importante ressaltar que sua técnica também foi capaz de resolver problemas com novas combinações de restrições e um maior número de objetos, que os modelos não viam durante o treinamento.
Devido a esta generalização, sua técnica pode ser usada para ensinar robôs como compreender e atender às restrições gerais dos problemas de empacotamento, como a importância de evitar colisões ou o desejo de um objeto estar próximo a outro objeto. Os robôs treinados desta forma poderiam ser aplicados a uma ampla gama de tarefas complexas em diversos ambientes, desde o atendimento de pedidos em um armazém até a organização de uma estante de livros na casa de alguém.
“Minha visão é forçar os robôs a realizar tarefas mais complicadas que têm muitas restrições geométricas e decisões mais contínuas que precisam ser tomadas – esses são os tipos de problemas que os robôs de serviço enfrentam em nossos ambientes humanos diversificados e não estruturados. Com a poderosa ferramenta de composição modelos de difusão, agora podemos resolver esses problemas mais complexos e obter ótimos resultados de generalização”, diz Zhutian Yang, estudante de graduação em engenharia elétrica e ciência da computação e autor principal de um artigo sobre essa nova técnica de aprendizado de máquina.
Seus coautores incluem os estudantes de pós-graduação do MIT, Jiayuan Mao e Yilun Du; Jiajun Wu, professor assistente de ciência da computação na Universidade de Stanford; Joshua B. Tenenbaum, professor do Departamento de Cérebro e Ciências Cognitivas do MIT e membro do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL); Tomás Lozano-Pérez, professor de ciência da computação e engenharia do MIT e membro do CSAIL; e a autora sênior Leslie Kaelbling, professora Panasonic de Ciência da Computação e Engenharia no MIT e membro do CSAIL. A pesquisa será apresentada na Conferência sobre Aprendizagem de Robôs, realizada em Atlanta, Geórgia, de 6 a 9 de novembro.
Complicações de restrição
Problemas de satisfação de restrições contínuas são particularmente desafiadores para robôs. Esses problemas aparecem em tarefas de manipulação de robôs em várias etapas, como colocar itens em uma caixa ou arrumar uma mesa de jantar. Freqüentemente, envolvem o cumprimento de uma série de restrições, incluindo restrições geométricas, como evitar colisões entre o braço do robô e o ambiente; restrições físicas, como empilhar objetos para que fiquem estáveis; e restrições qualitativas, como colocar uma colher à direita de uma faca.
Pode haver muitas restrições e elas variam entre problemas e ambientes, dependendo da geometria dos objetos e dos requisitos especificados pelo homem.
Para resolver esses problemas de forma eficiente, os pesquisadores do MIT desenvolveram uma técnica de aprendizado de máquina chamada Diffusion-CCSP. Os modelos de difusão aprendem a gerar novas amostras de dados que se assemelham a amostras em um conjunto de dados de treinamento, refinando iterativamente sua saída.
Para fazer isso, os modelos de difusão aprendem um procedimento para fazer pequenas melhorias em uma solução potencial. Então, para resolver um problema, eles começam com uma solução aleatória e muito ruim e depois a melhoram gradativamente.
Por exemplo, imagine colocar pratos e utensílios aleatoriamente em uma mesa simulada, permitindo que eles se sobreponham fisicamente. As restrições sem colisão entre objetos farão com que eles se afastem, enquanto as restrições qualitativas arrastarão o prato para o centro, alinharão o garfo de salada e o garfo de jantar, etc.
Os modelos de difusão são adequados para este tipo de problema contínuo de satisfação de restrições porque as influências de múltiplos modelos na pose de um objeto podem ser compostas para encorajar a satisfação de todas as restrições, explica Yang. Partindo sempre de uma estimativa inicial aleatória, os modelos podem obter um conjunto diversificado de boas soluções.
Trabalhando juntos
Para o Diffusion-CCSP, os pesquisadores queriam capturar a interconectividade das restrições. Na embalagem, por exemplo, uma restrição pode exigir que um determinado objeto esteja próximo a outro objeto, enquanto uma segunda restrição pode especificar onde um desses objetos deve estar localizado.
Diffusion-CCSP aprende uma família de modelos de difusão, com um para cada tipo de restrição. Os modelos são treinados em conjunto, portanto compartilham alguns conhecimentos, como a geometria dos objetos a serem empacotados.
Os modelos então trabalham juntos para encontrar soluções, neste caso locais para os objetos a serem colocados, que satisfaçam conjuntamente as restrições.
“Nem sempre chegamos a uma solução na primeira tentativa. Mas quando você continua refinando a solução e alguma violação acontece, isso deve levar você a uma solução melhor. Você recebe orientação ao fazer algo errado”, diz ela.
Treinar modelos individuais para cada tipo de restrição e depois combiná-los para fazer previsões reduz bastante a quantidade de dados de treinamento necessários, em comparação com outras abordagens.
Porém, treinar esses modelos ainda requer uma grande quantidade de dados que demonstrem problemas resolvidos. Os humanos precisariam resolver cada problema com métodos lentos tradicionais, tornando proibitivo o custo para gerar tais dados, diz Yang.
Em vez disso, os pesquisadores reverteram o processo, encontrando primeiro as soluções. Eles usaram algoritmos rápidos para gerar caixas segmentadas e ajustar um conjunto diversificado de objetos 3D em cada segmento, garantindo empacotamento compacto, poses estáveis e soluções livres de colisões.
“Com esse processo, a geração de dados é quase instantânea na simulação. Podemos gerar dezenas de milhares de ambientes onde sabemos que os problemas têm solução”, afirma.
Treinados com esses dados, os modelos de difusão trabalham juntos para determinar os locais onde os objetos devem ser colocados pela garra robótica que realizam a tarefa de empacotamento enquanto atendem a todas as restrições.
Eles conduziram estudos de viabilidade e, em seguida, demonstraram o Diffusion-CCSP com um robô real resolvendo uma série de problemas difíceis, incluindo encaixar triângulos 2D em uma caixa, empacotar formas 2D com restrições de relacionamento espacial, empilhar objetos 3D com restrições de estabilidade e empacotar objetos 3D com um braço robótico.
Seu método superou outras técnicas em muitos experimentos, gerando um maior número de soluções eficazes que eram estáveis e livres de colisões.
No futuro, Yang e seus colaboradores querem testar o Diffusion-CCSP em situações mais complicadas, como com robôs que podem se mover por uma sala. Eles também querem permitir que o Diffusion-CCSP resolva problemas em diferentes domínios sem a necessidade de ser treinado novamente com novos dados.
“Diffusion-CCSP é uma solução de aprendizado de máquina que se baseia em modelos generativos poderosos existentes”, diz Danfei Xu, professor assistente na Escola de Computação Interativa do Instituto de Tecnologia da Geórgia e cientista pesquisador da NVIDIA AI, que não esteve envolvido com este trabalho. “Ele pode gerar rapidamente soluções que satisfaçam simultaneamente múltiplas restrições, compondo modelos de restrições individuais conhecidos. Embora ainda esteja nas fases iniciais de desenvolvimento, os avanços contínuos nesta abordagem mantêm a promessa de permitir sistemas autônomos mais eficientes, seguros e confiáveis em vários formulários.”
Mais Informações:
Zhutian Yang et al, Solucionadores de restrições contínuas baseados em difusão composicional, arXiv (2023). DOI: 10.48550/arxiv.2309.00966
arXiv
Fornecido pelo Instituto de Tecnologia de Massachusetts
Esta história foi republicada como cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisa, inovação e ensino do MIT.
Citação: Nova técnica ajuda robôs a empacotar objetos em um espaço apertado (2023, 17 de outubro) recuperado em 17 de outubro de 2023 em https://techxplore.com/news/2023-10-technique-robots-tight-space.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.