Rede neural “líquida” se adapta em qualquer lugar

No reino da inteligência artificial, maior deve ser melhor. Redes neurais com bilhões de parâmetros alimentam ferramentas diárias baseadas em IA, como ChatGPT e Dall-E, e cada novo modelo de linguagem grande (LLM) supera seus predecessores em tamanho e complexidade. Enquanto isso, no Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT, um grupo de pesquisadores tem trabalhado para diminuir o tamanho.

Em pesquisas recentes, eles demonstraram a eficiência de um novo tipo de sistema de aprendizado de máquina muito pequeno, com 20.000 parâmetros, chamado rede neural líquida. Eles mostraram que os drones equipados com eles se destacavam em navegar em ambientes novos e complexos com precisão, superando até os sistemas de última geração. Os sistemas foram capazes de tomar decisões que os levaram a um alvo em florestas e espaços urbanos anteriormente inexplorados, e podiam fazê-lo na presença de ruído adicional e outras dificuldades.

As redes neurais em sistemas típicos de aprendizado de máquina aprendem apenas durante o processo de treinamento. Depois disso, seus parâmetros são corrigidos. As redes neurais líquidas, explica Ramin Hasani, um dos cientistas do CSAIL, são uma classe de sistemas de inteligência artificial que aprendem no trabalho, mesmo após o treinamento. Em outras palavras, eles compreendem algoritmos “líquidos” que se adaptam continuamente a novas informações, como um novo ambiente, assim como os cérebros dos organismos vivos. “Eles são modelados diretamente de acordo com a forma como os neurônios e sinapses interagem nos cérebros biológicos”, diz Hasani. Na verdade, sua arquitetura de rede é inspirada no sistema nervoso de criaturas vivas chamadas C. elegansminúsculos vermes comumente encontrados no solo.

“Podemos implementar uma rede neural líquida que pode dirigir um carro em um Raspberry Pi”

O objetivo desse experimento não era apenas a navegação autônoma robusta de um drone, diz Hasani. “Tratava-se de testar as capacidades de compreensão de tarefas das redes neurais quando elas são implantadas em nossa sociedade como sistemas autônomos.”

Como dados de treinamento para as redes neurais que controlariam o drone, os pesquisadores usaram imagens de drone coletadas por um piloto humano enquanto voavam em direção a um alvo. “Você espera que o sistema tenha aprendido a se mover em direção ao objeto”, diz Hasani, sem ter definido o que é o objeto ou fornecido qualquer rótulo sobre o ambiente. “O drone tem que inferir que a tarefa é esta: eu quero ir em direção [the object].”

A equipe realizou uma série de experimentos para testar como as habilidades de navegação aprendidas são transferidas para ambientes novos e nunca antes vistos. Eles testaram o sistema em muitos cenários do mundo real, inclusive em diferentes estações do ano em uma floresta e em um ambiente urbano. Os drones foram submetidos a testes de alcance e estresse, e os alvos foram girados, ocluídos, colocados em movimento e muito mais. As redes neurais líquidas eram as únicas que podiam generalizar para cenários que nunca haviam visto, sem nenhum ajuste fino, e podiam realizar essa tarefa de maneira contínua e confiável.

A aplicação de redes neurais líquidas à robótica pode levar a sistemas de navegação autônomos mais robustos, para busca e salvamento, monitoramento da vida selvagem e entregas, entre outras coisas. A mobilidade inteligente, de acordo com Hasani, será crucial à medida que as cidades se tornam mais densas, e o tamanho pequeno dessas redes neurais pode ser uma grande vantagem: “Podemos implementar uma rede neural líquida que pode dirigir um carro em um Raspberry Pi”.

Além dos drones e da mobilidade

Mas os pesquisadores acreditam que as redes neurais líquidas podem ir ainda mais longe, tornando-se o futuro da tomada de decisão relacionada a qualquer tipo de processamento de dados de séries temporais, incluindo processamento de vídeo e linguagem. Como as redes neurais líquidas são mecanismos de processamento de dados sequenciais, elas podem prever eventos financeiros e médicos. Ao processar os sinais vitais, por exemplo, podem ser desenvolvidos modelos para prever o estado de um paciente na UTI.

Além de suas outras vantagens, as redes neurais líquidas também oferecem explicabilidade e interpretabilidade. Em outras palavras, eles abrem a proverbial caixa preta do processo de tomada de decisão do sistema. “Se eu tiver apenas 34 neurônios [in the drone system], posso literalmente descobrir qual é a função de cada elemento”, diz Hasani. Isso é algo que seria virtualmente impossível em uma rede neural profunda em larga escala. O tamanho menor das redes neurais líquidas também reduz enormemente o custo computacional e, portanto, as pegadas de carbono dos modelos de aprendizado de máquina.

Hasani e seus colegas estão procurando maneiras de melhorar as redes neurais líquidas. “Este artigo cobriu um tipo de capacidade de raciocínio muito controlado e direto, mas as interações do mundo real exigem problemas de raciocínio cada vez mais sofisticados”, diz ele. A equipe gostaria de projetar tarefas mais complexas e testar as redes neurais líquidas até o limite, ao mesmo tempo em que descobre por que as redes neurais líquidas têm um desempenho muito melhor do que seus concorrentes em testes de raciocínio.

Hasani explica redes neurais líquidas neste vídeo:

Redes Neurais Líquidas | Ramin Hasani | TEDxMITYouTube

Artigos do seu site

Artigos Relacionados na Web

Deixe uma resposta