Os robôs estão ao nosso redor, desde drones filmando vídeos no céu até servindo comida em restaurantes e detonando bombas em emergências. Lenta mas seguramente, os robôs estão melhorando a qualidade da vida humana, aumentando nossas habilidades, liberando tempo e melhorando nossa segurança e bem-estar pessoal. Enquanto os robôs existentes estão se tornando mais proficientes em tarefas simples, lidar com solicitações mais complexas exigirá mais desenvolvimento em mobilidade e inteligência.
Os cientistas da computação da Columbia Engineering e do Toyota Research Institute estão investigando a psicologia, a física e a geometria para criar algoritmos para que os robôs possam se adaptar ao ambiente e aprender a fazer as coisas de forma independente. Este trabalho é vital para permitir que os robôs enfrentem novos desafios decorrentes de uma sociedade em envelhecimento e forneçam melhor suporte, especialmente para idosos e pessoas com deficiência.
Ensinar robôs oclusão e permanência de objetos
Um desafio de longa data na visão computacional é a permanência do objeto, um conceito bem conhecido na psicologia que envolve a compreensão de que a existência de um objeto é separada de se ele é visível a qualquer momento. É fundamental que os robôs entendam nosso mundo dinâmico e em constante mudança. Mas a maioria dos aplicativos em visão computacional ignora totalmente as oclusões e tende a perder o controle de objetos que ficam temporariamente ocultos da vista.
“Alguns dos problemas mais difíceis para a inteligência artificial são os mais fáceis para os humanos”, disse Carl Vondrick, professor associado de ciência da computação e ganhador do prêmio Young Faculty do Toyota Research Institute. Pense em como as crianças brincam de esconde-esconde e aprendem que seus pais não desaparecem quando cobrem o rosto. Os computadores, por outro lado, perdem a noção quando algo é bloqueado ou oculto e não conseguem processar para onde o objeto foi ou lembrar sua localização.
Para resolver esse problema, Vondrick e sua equipe ensinaram às redes neurais os conceitos físicos básicos que vêm naturalmente para adultos e crianças. Da mesma forma que uma criança aprende física observando o desenrolar dos eventos ao seu redor, a equipe criou uma máquina que assiste a muitos vídeos para aprender conceitos físicos. A ideia-chave é treinar o computador para antecipar como seria a cena no futuro. Ao treinar a máquina para resolver essa tarefa em muitos exemplos, a máquina cria automaticamente um modelo interno de como os objetos se movem fisicamente em ambientes típicos. Por exemplo, quando uma lata de refrigerante desaparece de vista dentro da geladeira, a máquina aprende a lembrar que ela ainda existe porque ela reaparece quando a porta da geladeira é reaberta.
“Já trabalhei com imagens e vídeos antes, mas conseguir que as redes neurais funcionem bem com informações 3-D é surpreendentemente complicado”, disse Basile Van Hoorick, Ph.D. do terceiro ano. aluno que trabalhou com Vondrick para desenvolver a estrutura que pode entender as oclusões conforme elas ocorrem. Ao contrário dos humanos, uma compreensão da tridimensionalidade do nosso mundo não vem naturalmente para os computadores. O segundo salto no projeto não foi apenas converter os dados das câmeras em 3-D sem problemas, mas também reconstruir toda a configuração da cena além do que pode ser visto.
Este trabalho pode expandir amplamente as capacidades de percepção dos robôs domésticos. Em qualquer ambiente interno, as coisas ficam ocultas o tempo todo. Portanto, os robôs precisam interpretar seus arredores de forma inteligente. A situação da “lata de refrigerante dentro da geladeira” é um dos muitos exemplos. Ainda assim, é fácil ver como qualquer aplicativo que usa a visão se beneficiará se os robôs puderem usar suas habilidades de memória e raciocínio de permanência de objetos para rastrear objetos e humanos enquanto eles se movem pela casa.
Indo além da suposição de corpo rígido
A maioria dos robôs hoje é programada com uma série de suposições para que funcionem. Uma é a suposição do corpo rígido, que assume que um objeto é sólido e não muda de forma. E isso simplifica muita coisa. Roboticistas podem ignorar completamente a física do objeto com o qual o robô está interagindo e só precisam pensar no movimento do robô.
O Columbia Artificial Intelligence and Robotics Lab (CAIR), liderado pelo professor assistente de ciência da computação Shuran Song, tem pesquisado o movimento robótico de uma maneira diferente. Sua pesquisa se concentra em objetos deformáveis e não rígidos – eles se dobram, dobram e mudam de forma. Ao trabalhar com objetos deformáveis, os roboticistas não podem mais confiar na suposição do corpo rígido, forçando-os a pensar novamente na física.
“Em nosso trabalho, estamos tentando investigar como os humanos intuitivamente fazem as coisas”, disse Shuran Song, também premiado pelo Toyota Research Institute Young Faculty. Em vez de tentar contabilizar todos os parâmetros possíveis, sua equipe desenvolveu um algoritmo que permite ao robô aprender fazendo, tornando-o mais generalizável e diminuindo a necessidade de grandes quantidades de dados de treinamento. Isso forçou o grupo a repensar como as pessoas realizam uma ação, como acertar um alvo com uma corda. Normalmente não pensamos na trajetória da corda – em vez disso, tentamos atingir o objeto primeiro e ajustar nossos movimentos até obtermos sucesso. “Essa nova perspectiva foi essencial para resolver esse difícil problema da robótica”, observou Song.
Sua equipe ganhou o prêmio de Melhor Artigo na Robot Science and Systems Conference (RSS 2022) por um algoritmo que desenvolveram, Iterative Residual Policy (IRP). O IRP é uma estrutura de aprendizado geral para tarefas repetíveis com dinâmicas complexas, onde um único modelo foi treinado usando dados de simulação imprecisos. O algoritmo pode aprender com esses dados e atingir muitos alvos com cordas desconhecidas em experimentos robóticos, atingindo precisão de subpolegadas e demonstrando sua forte capacidade de generalização.
“Anteriormente, para atingir esse nível de precisão, o robô precisava executar a tarefa talvez de 100 a 1.000 vezes”, disse Cheng Chi, Ph.D. do terceiro ano. aluno que trabalhou com Song para desenvolver o IRP. “Com nosso sistema, podemos fazer isso em dez vezes, o que é aproximadamente o mesmo desempenho de uma pessoa.”
Os pesquisadores notaram que ainda havia algumas limitações com o movimento de arremesso que seu robô poderia fazer. Embora o movimento de arremesso seja eficaz, ele é limitado pela velocidade do braço do robô, o que significa que ele não pode lidar com itens grandes. Sem mencionar que é perigoso ter um movimento rápido de arremesso em torno das pessoas.
A equipe de Song levou essa pesquisa um passo adiante e desenvolveu uma nova abordagem para manipulá-los usando ar ativamente soprado. Eles armaram seu robô com uma bomba de ar e ele foi capaz de desdobrar rapidamente um grande pedaço de pano ou abrir um saco plástico. A estrutura de aprendizagem auto-supervisionada que eles chamam de DextAIRity aprende a realizar uma tarefa de forma eficaz por meio de uma sequência de ações de agarrar ou soprar com base no ar. Usando feedback visual, o sistema usa uma formulação de circuito fechado que ajusta continuamente sua direção de sopro.
“Uma das estratégias interessantes que o sistema desenvolveu com a tarefa de abrir o saco é apontar o ar um pouco acima do saco plástico para mantê-lo aberto”, disse Zhenjia Xu, Ph.D. do quarto ano. aluno que trabalha com Canção no Laboratório do CAIR. “Não anotamos ou treinamos de forma alguma; ele aprendeu sozinho.”
O que precisa ser feito para tornar os robôs mais úteis em nossas casas?
Atualmente, os robôs podem manobrar com sucesso em um ambiente estruturado com áreas claramente definidas e realizar uma tarefa simultaneamente. No entanto, um robô doméstico realmente útil deve ter várias habilidades, ser capaz de trabalhar em um ambiente desestruturado, como uma sala de estar com brinquedos no chão, e lidar com diferentes situações. Esses robôs também precisarão saber como identificar uma tarefa e quais subtarefas devem ser executadas em que ordem. E então, eles precisarão saber o que fazer a seguir se falharem em um trabalho e como se adaptar às próximas etapas necessárias para atingir seu objetivo.
“O progresso que Carl Vondrick e Shuran Song fizeram com suas pesquisas contribui diretamente para a missão do Toyota Research Institute”, diz o Dr. Eric Krotkov, consultor do Programa de Pesquisa da Universidade. “A pesquisa da TRI em robótica e além se concentra no desenvolvimento de capacidades e ferramentas para enfrentar os desafios socioeconômicos de uma sociedade envelhecida, escassez de mão de obra e produção sustentável. qualidade de vida para todos.”
Song e Vondrick planejam colaborar para combinar seus respectivos conhecimentos em robótica e visão computacional para criar robôs que ajudem as pessoas em casa. Ao ensinar as máquinas a entender os objetos do cotidiano nas casas, como roupas, comida e caixas, a tecnologia pode permitir que os robôs ajudem pessoas com deficiência motora e melhorem a qualidade da vida cotidiana das pessoas. Ao aumentar o número de objetos e conceitos físicos que podem ser aprendidos pelos robôs, a equipe pretende tornar essas aplicações possíveis no futuro.
Fornecido pela Escola de Engenharia e Ciências Aplicadas da Universidade de Columbia
Citação: Engenheiros usam psicologia, física e geometria para tornar os robôs mais inteligentes (2023, 8 de março) recuperado em 8 de março de 2023 em https://techxplore.com/news/2023-03-psychology-physics-geometry-robots-intelligent.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.