Algoritmo leva robôs um passo mais perto de serem capazes de ‘agir por intuição’

Pesquisadores da Herts dão mais um passo em direção ao desenvolvimento de robôs capazes de

Robôs jogam Xadrez contra funcionários e alunos da Universidade. Crédito: University of Hertfordshire

Pesquisadores da Universidade de Hertfordshire desenvolveram um novo algoritmo que permitirá que robôs funcionem de forma mais intuitiva, ou seja, tomem decisões usando seu ambiente como orientação.

O princípio é que, por meio do algoritmo, o agente robô cria seus próprios objetivos.

Pela primeira vez, o algoritmo unifica diferentes abordagens de definição de metas sob um conceito que está diretamente ligado à física e, além disso, torna esse cálculo transparente para que outros possam estudá-lo e adotá-lo.

O princípio do algoritmo está relacionado à famosa teoria do caos, pois o método torna o agente “mestre do caos da dinâmica do sistema”.

O estudo foi publicado na revista Vida PRX. Os pesquisadores de Herts exploraram “modelos de motivação” de robôs que imitam os processos de tomada de decisão de humanos e animais, mesmo na ausência de sinais claros de recompensa.

O estudo apresenta fórmulas de inteligência artificial (IA) que calculam uma maneira de um robô decidir ações futuras sem instruções diretas ou intervenção humana.

Daniel Polani, professor de Ciência da Computação e autor sênior, explica: “Em um sentido aplicado, o que isso poderia significar, por exemplo, é fazer um robô brincar e manipular objetos sozinho, sem que lhe seja ordenado a fazê-lo.

“Isso poderia melhorar a maneira como os robôs aprendem a interagir tanto com humanos quanto com outros robôs, incentivando comportamentos e interações mais ‘naturais’.

“Isso tem outras aplicações, como o comportamento de sobrevivência de robôs semiautônomos colocados em situações nas quais são inacessíveis a um operador humano, como em locais subterrâneos ou interplanetários.”

Em humanos e animais, uma teoria assume a existência de uma “motivação intrínseca”, onde os comportamentos são movidos apenas pela interação entre o ser e seu ambiente, em vez de recompensas aprendidas específicas, como comida. Este artigo traduz com sucesso essa teoria de “motivação intrínseca” em uma que pode ser usada por agentes robóticos.

O professor Polani acrescenta: “Este trabalho é empolgante porque agora podemos implementar um mecanismo semelhante aos que ajudam humanos e animais a resolver novos problemas sem experiência prévia em robôs.

“Esperamos poder construir sobre esse trabalho para desenvolver robôs mais semelhantes aos humanos no futuro, com processos mais intuitivos. Isso abre uma grande oportunidade para robôs mais sofisticados com processos de decisão semelhantes aos nossos.”

A teoria subjacente a este artigo, chamada “maximização do empoderamento”, foi desenvolvida na Herts por muitos anos. Ela sugere que, ao aumentar o alcance de resultados futuros, um robô terá melhores opções também em um futuro mais longo. É importante ressaltar que este método substitui e, portanto, possivelmente elimina sistemas de recompensa tradicionais (por exemplo, sinais de comida).

Embora a maximização do empoderamento tenha se mostrado promissora, ela ainda não é totalmente compreendida ou amplamente aplicada. A maioria dos estudos costumava depender de simulações, enquanto calculava meticulosamente as informações necessárias para sistemas complexos e a teoria continua desafiadora.

No entanto, esta última pesquisa inovadora visa explicar por que motivações baseadas em empoderamento podem criar comportamentos semelhantes aos de organismos vivos, potencialmente levando a robôs mais motivados intrinsecamente; e também oferece uma maneira significativamente melhorada de calcular essas motivações.

O professor Polani diz que os próximos passos são usar esse algoritmo inovador para permitir que os robôs descubram mais sobre o mundo, desenvolvendo aprendizado direto e identificando e aprimorando novas habilidades que aumentariam seu valor em cenários do mundo real.

Mais informações:
Stas Tiomkin et al, Motivação intrínseca em sistemas de controle dinâmico, Vida PRX (2024). DOI: 10.1103/PRXLife.2.033009

Fornecido pela Universidade de Hertfordshire

Citação: Algoritmo leva robôs um passo mais perto de serem capazes de “agir por intuição” (2024, 11 de setembro) recuperado em 11 de setembro de 2024 de https://techxplore.com/news/2024-09-algorithm-robots-closer-intuition.html

Este documento está sujeito a direitos autorais. Além de qualquer uso justo para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.



Deixe uma resposta