Aprender com os erros do passado não se limita aos humanos. Os computadores também o fazem. Nas indústrias, isso é feito por meio de sistemas de controle baseados em computador que ajudam a operar os sistemas de produção. Para robôs industriais que executam tarefas específicas em lotes, digamos, produção de roupas, chips de computador ou produtos de panificação, a técnica de controle mais comumente usada é o controle de aprendizado iterativo (ILC). A maioria das indústrias ainda depende de sistemas ILC que usam uma estratégia de aprendizado chamada regra de atualização de tipo proporcional (PTUR). Essa técnica melhora o desempenho dos sistemas ILC repetindo a mesma tarefa repetidamente e atualizando sua entrada de controle com base nos erros encontrados nas iterações anteriores.
No entanto, essa metodologia de controle foi proposta décadas atrás. E como os sistemas ILC estão sendo cada vez mais adotados para a execução de tarefas mais complexas, há a necessidade de técnicas que possam aprender mais rápido e com maior precisão.
Em uma descoberta recente, um grupo de cientistas propôs uma nova técnica que usa a regra de atualização de potência fracionada (FPUR) para melhorar o potencial de desempenho de sistemas ILC lineares de entrada única e saída única. O estudo foi publicado no IEEE/CAA Journal of Automatica Sinica.
As taxas de convergência – as taxas nas quais a diferença entre a saída desejada e a saída real diminui ao longo do tempo – desempenham um papel crucial na definição da eficiência de um sistema ILC. Os métodos existentes para melhorar a taxa de convergência geralmente se mostram insatisfatórios em situações que exigem alta precisão. Mesmo no caso de ganhos de aprendizado constantes ou selecionados manualmente, os sistemas ILC atuais que usam o método de atualização linear não conseguem explorar ao máximo as informações disponíveis. Portanto, os cientistas investigaram abordagens além do PTUR, que utilizavam métodos de atualização não linear para aprender e alcançar a saída desejada.
“O PTUR tradicional usa um termo linear para o erro de rastreamento para atualizar a entrada de controle. Por outro lado, o FPUR usa um termo fracionário para atualização. é maior que o PTUR para pequenos erros de rastreamento, levando a uma taxa de convergência mais rápida”, explica Zihan Li, principal autor do estudo e aluno de mestrado na Escola de Matemática da Universidade Renmin da China.
A equipe desenvolveu um novo método FPUR inspirado nas estratégias mais recentes de controle de tempo finito (FTC) e controle de modo deslizante terminal (TSMC), que são técnicas potenciais para superar os problemas mencionados anteriormente e melhorar a velocidade de convergência. Os cientistas também adotaram uma abordagem de mapeamento não linear para explorar a dinâmica do erro ao longo do tempo. Essa abordagem permitiu relatar o desempenho de convergência rápida e caracterizar possíveis ciclos de limite de erros de rastreamento em sistemas ILC. Além disso, simulações numéricas também foram realizadas para validar a eficácia do novo método.
Quando questionado sobre como o sistema proposto mudaria o campo dos sistemas ILC, Li disse: “Este estudo atende a três propósitos principais. Primeiro, ele fornece um algoritmo que usa um método de atualização não linear para melhorar a capacidade de aprendizado. Segundo, mostra que a adaptação os termos de potência fracionária permitem que a taxa de convergência seja regulada com base no desempenho real. E, finalmente, exibe taxas de convergência rápidas equivalentes às da FTC e TMSC.”
Este estudo demonstrou, pela primeira vez, o uso do FPUR para ILC em sistemas lineares de entrada única e saída única. A técnica proposta poderia ser usada em outros sistemas repetitivos, como veículos autônomos, veículos aéreos não tripulados e robôs de reabilitação.
Mais Informações:
Zihan Li et al, aprimorando o controle de aprendizado iterativo com a lei de atualização de potência fracionária, IEEE/CAA Journal of Automatica Sinica (2023). DOI: 10.1109/JAS.2023.123525
Fornecido por Cactus Communications
Citação: Uma nova técnica para melhorar a capacidade de aprendizado de robôs que executam tarefas repetitivas (2023, 5 de junho) recuperada em 5 de junho de 2023 em https://techxplore.com/news/2023-06-technique-ability-robots-repetitive-tasks. html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins informativos.