Uma arquitetura por subconjunto consiste em caminhos e obstáculos apresentados, convoluções 3D, convoluções 2D e uma rede totalmente conectada. Os caminhos atuais Seu e caminhos mais curtos p(s, g) para todos os agentes são ilustrados para referência (canto superior direito). Crédito: Pesquisa de vizinhança neural para localização de caminho multiagente – cópia de revisão (2024)
Centenas de robôs vão e voltam pelo chão de um colossal armazém robótico, pegando itens e entregando-os a trabalhadores humanos para embalagem e envio. Esses armazéns estão cada vez mais a tornar-se parte da cadeia de abastecimento em muitas indústrias, desde o comércio eletrónico até à produção automóvel.
No entanto, levar 800 robôs de e para seus destinos de maneira eficiente e, ao mesmo tempo, evitar que eles colidam uns com os outros não é uma tarefa fácil. É um problema tão complexo que mesmo os melhores algoritmos de localização de caminhos lutam para acompanhar o ritmo vertiginoso do comércio eletrónico ou da produção.
De certa forma, esses robôs são como carros tentando navegar no centro de uma cidade lotada. Assim, um grupo de pesquisadores do MIT que usa IA para mitigar o congestionamento do tráfego aplicou ideias desse domínio para resolver esse problema.
Eles construíram um modelo de aprendizagem profunda que codifica informações importantes sobre o armazém, incluindo robôs, caminhos planejados, tarefas e obstáculos, e o utilizam para prever as melhores áreas do armazém para descongestionar e melhorar a eficiência geral.
A sua técnica divide os robôs do armazém em grupos, para que estes grupos mais pequenos de robôs possam ser descongestionados mais rapidamente com algoritmos tradicionais utilizados para coordenar robôs. No final, o método deles descongestiona os robôs quase quatro vezes mais rápido do que um método forte de busca aleatória.
Além de agilizar as operações de armazém, esta abordagem de aprendizagem profunda poderia ser usada em outras tarefas complexas de planejamento, como projeto de chips de computador ou roteamento de tubulações em grandes edifícios.
“Desenvolvemos uma nova arquitetura de rede neural que é realmente adequada para operações em tempo real na escala e complexidade desses armazéns”.
“Ele pode codificar centenas de robôs em termos de suas trajetórias, origens, destinos e relacionamentos com outros robôs, e pode fazer isso de uma maneira eficiente que reutiliza a computação entre grupos de robôs”, diz Cathy Wu, do Gilbert W. Winslow. Professor Auxiliar de Desenvolvimento de Carreira em Engenharia Civil e Ambiental (CEE), e membro do Laboratório de Sistemas de Informação e Decisão (LIDS) e do Instituto de Dados, Sistemas e Sociedade (IDSS).
Wu, o autor sênior de um artigo sobre esta técnica, é acompanhado pelo autor principal Zhongxia Yan, um estudante de graduação em engenharia elétrica e ciência da computação. O trabalho será apresentado na Conferência Internacional sobre Representações de Aprendizagem.
Tetris robótico
Do ponto de vista de um pássaro, o piso de um armazém robótico de comércio eletrônico parece um pouco com um jogo acelerado de “Tetris”.
Quando chega um pedido de um cliente, um robô viaja até uma área do armazém, agarra a prateleira que contém o item solicitado e o entrega a um operador humano que seleciona e embala o item. Centenas de robôs fazem isso simultaneamente e, se os caminhos de dois robôs entrarem em conflito ao cruzarem o enorme armazém, eles poderão falhar.
Os algoritmos tradicionais baseados em pesquisa evitam possíveis falhas, mantendo um robô em seu curso e replanejando uma trajetória para o outro. Mas com tantos robôs e potenciais colisões, o problema cresce rapidamente e exponencialmente.
“Como o armazém está operando on-line, os robôs são replanejados a cada 100 milissegundos. Isso significa que a cada segundo, um robô é replanejado 10 vezes. Portanto, essas operações precisam ser muito rápidas”, diz Wu.
Como o tempo é tão crítico durante o replanejamento, os pesquisadores do MIT usam o aprendizado de máquina para concentrar o replanejamento nas áreas de congestionamento mais acionáveis – onde existe maior potencial para reduzir o tempo total de viagem dos robôs.
Wu e Yan construíram uma arquitetura de rede neural que considera grupos menores de robôs ao mesmo tempo. Por exemplo, em um armazém com 800 robôs, a rede pode dividir o armazém em grupos menores que contenham 40 robôs cada.
Em seguida, ele prevê qual grupo tem maior potencial para melhorar a solução geral se um solucionador baseado em pesquisa for usado para coordenar as trajetórias dos robôs nesse grupo.
Um processo iterativo, o algoritmo geral escolhe o grupo de robôs mais promissor com a rede neural, descongestiona o grupo com o solucionador baseado em pesquisa e, em seguida, escolhe o próximo grupo mais promissor com a rede neural e assim por diante.
Considerando relacionamentos
A rede neural pode raciocinar sobre grupos de robôs de forma eficiente porque captura relacionamentos complicados que existem entre robôs individuais. Por exemplo, mesmo que um robô possa estar inicialmente distante de outro, seus caminhos ainda podem se cruzar durante as viagens.
A técnica também agiliza a computação codificando as restrições apenas uma vez, em vez de repetir o processo para cada subproblema. Por exemplo, num armazém com 800 robôs, descongestionar um grupo de 40 robôs requer manter os outros 760 robôs como restrições. Outras abordagens exigem raciocínio sobre todos os 800 robôs uma vez por grupo em cada iteração.
Em vez disso, a abordagem dos investigadores requer apenas um raciocínio sobre os 800 robôs uma vez em todos os grupos em cada iteração.
“O armazém é um grande ambiente, portanto muitos desses grupos de robôs terão alguns aspectos compartilhados do problema maior. Projetamos nossa arquitetura para fazer uso dessas informações comuns”, acrescenta ela.
Eles testaram sua técnica em vários ambientes simulados, incluindo alguns configurados como armazéns, alguns com obstáculos aleatórios e até mesmo ambientes labirínticos que emulam interiores de edifícios.
Ao identificar grupos mais eficazes para descongestionar, a sua abordagem baseada na aprendizagem descongestiona o armazém até quatro vezes mais rápido do que abordagens fortes e não baseadas na aprendizagem. Mesmo quando levaram em consideração a sobrecarga computacional adicional da execução da rede neural, sua abordagem ainda resolveu o problema 3,5 vezes mais rápido.
No futuro, os pesquisadores desejam obter insights simples e baseados em regras de seu modelo neural, uma vez que as decisões da rede neural podem ser opacas e difíceis de interpretar. Métodos mais simples e baseados em regras também poderiam ser mais fáceis de implementar e manter em ambientes reais de armazéns robóticos.
Mais Informações:
Artigo: Pesquisa de vizinhança neural para localização de caminhos multiagentes
Fornecido pelo Instituto de Tecnologia de Massachusetts
Esta história foi republicada como cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisa, inovação e ensino do MIT.
Citação: Novo modelo de IA poderia agilizar as operações em um armazém robótico (2024, 27 de fevereiro) recuperado em 27 de fevereiro de 2024 em https://techxplore.com/news/2024-02-ai-robotic-warehouse.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.