Uma nova técnica para melhorar a capacidade de aprendizado de robôs que executam tarefas repetitivas

Uma nova técnica para melhorar a capacidade de aprendizado de robôs que executam tarefas repetitivas

O uso de uma nova regra de atualização de potência fracionária (FPUR) melhora a convergência de sistemas de aprendizado iterativo (ILCs) Crédito: Zihan Li, Dong Shen e Xinghuo

Aprender com os erros do passado não se limita aos humanos. Os computadores também o fazem. Nas indústrias, isso é feito por meio de sistemas de controle baseados em computador que ajudam a operar os sistemas de produção. Para robôs industriais que executam tarefas específicas em lotes, digamos, produção de roupas, chips de computador ou produtos de panificação, a técnica de controle mais comumente usada é o controle de aprendizado iterativo (ILC). A maioria das indústrias ainda depende de sistemas ILC que usam uma estratégia de aprendizado chamada regra de atualização de tipo proporcional (PTUR). Essa técnica melhora o desempenho dos sistemas ILC repetindo a mesma tarefa repetidamente e atualizando sua entrada de controle com base nos erros encontrados nas iterações anteriores.

No entanto, essa metodologia de controle foi proposta décadas atrás. E como os sistemas ILC estão sendo cada vez mais adotados para a execução de tarefas mais complexas, há a necessidade de técnicas que possam aprender mais rápido e com maior precisão.

Em uma descoberta recente, um grupo de cientistas propôs uma nova técnica que usa a regra de atualização de potência fracionada (FPUR) para melhorar o potencial de desempenho de sistemas ILC lineares de entrada única e saída única. O estudo foi publicado no IEEE/CAA Journal of Automatica Sinica.

As taxas de convergência – as taxas nas quais a diferença entre a saída desejada e a saída real diminui ao longo do tempo – desempenham um papel crucial na definição da eficiência de um sistema ILC. Os métodos existentes para melhorar a taxa de convergência geralmente se mostram insatisfatórios em situações que exigem alta precisão. Mesmo no caso de ganhos de aprendizado constantes ou selecionados manualmente, os sistemas ILC atuais que usam o método de atualização linear não conseguem explorar ao máximo as informações disponíveis. Portanto, os cientistas investigaram abordagens além do PTUR, que utilizavam métodos de atualização não linear para aprender e alcançar a saída desejada.

Uma nova técnica para melhorar a capacidade de aprendizado de robôs que executam tarefas repetitivas

Rastreamento de curvas de precisão para regras de atualização de potência fracionária versus tipo proporcional (tipo P) sob diferentes potências fracionárias. Crédito: Zihan Li, Dong Shen e Xinghuo Yu

“O PTUR tradicional usa um termo linear para o erro de rastreamento para atualizar a entrada de controle. Por outro lado, o FPUR usa um termo fracionário para atualização. é maior que o PTUR para pequenos erros de rastreamento, levando a uma taxa de convergência mais rápida”, explica Zihan Li, principal autor do estudo e aluno de mestrado na Escola de Matemática da Universidade Renmin da China.

A equipe desenvolveu um novo método FPUR inspirado nas estratégias mais recentes de controle de tempo finito (FTC) e controle de modo deslizante terminal (TSMC), que são técnicas potenciais para superar os problemas mencionados anteriormente e melhorar a velocidade de convergência. Os cientistas também adotaram uma abordagem de mapeamento não linear para explorar a dinâmica do erro ao longo do tempo. Essa abordagem permitiu relatar o desempenho de convergência rápida e caracterizar possíveis ciclos de limite de erros de rastreamento em sistemas ILC. Além disso, simulações numéricas também foram realizadas para validar a eficácia do novo método.

Quando questionado sobre como o sistema proposto mudaria o campo dos sistemas ILC, Li disse: “Este estudo atende a três propósitos principais. Primeiro, ele fornece um algoritmo que usa um método de atualização não linear para melhorar a capacidade de aprendizado. Segundo, mostra que a adaptação os termos de potência fracionária permitem que a taxa de convergência seja regulada com base no desempenho real. E, finalmente, exibe taxas de convergência rápidas equivalentes às da FTC e TMSC.”

Este estudo demonstrou, pela primeira vez, o uso do FPUR para ILC em sistemas lineares de entrada única e saída única. A técnica proposta poderia ser usada em outros sistemas repetitivos, como veículos autônomos, veículos aéreos não tripulados e robôs de reabilitação.

Mais Informações:
Zihan Li et al, aprimorando o controle de aprendizado iterativo com a lei de atualização de potência fracionária, IEEE/CAA Journal of Automatica Sinica (2023). DOI: 10.1109/JAS.2023.123525

Fornecido por Cactus Communications

Citação: Uma nova técnica para melhorar a capacidade de aprendizado de robôs que executam tarefas repetitivas (2023, 5 de junho) recuperada em 5 de junho de 2023 em https://techxplore.com/news/2023-06-technique-ability-robots-repetitive-tasks. html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.



Deixe uma resposta