Expandindo a percepção do robô para dar uma consciência mais humana de seu ambiente

Expandir a percepção do robô

Legenda: “A percepção é um grande gargalo para fazer com que os robôs nos ajudem no mundo real”, diz Luca Carlone. “Se pudermos adicionar elementos de cognição e raciocínio à percepção do robô, acredito que eles podem fazer muito bem.” Crédito: Bryce Vickmark

Os robôs percorreram um longo caminho desde o Roomba. Hoje, os drones estão começando a entregar de porta em porta, os carros autônomos estão navegando em algumas estradas, os cães de robôs estão ajudando os socorristas, e ainda mais bots estão fazendo backflips e ajudando no chão da fábrica. Ainda assim, Luca Carlone acha que o melhor ainda está por vir.

Carlone, que recentemente recebeu posse como professor associado no Departamento de Aeronáutica e Astronáutica do MIT (Aerotro), dirige o Spark Lab, onde ele e seus alunos estão preenchendo uma lacuna importante entre humanos e robôs: percepção. O grupo faz pesquisas teóricas e experimentais, tudo para expandir a consciência de um robô de seu ambiente de maneiras que abordam a percepção humana. E a percepção, como Carlone costuma dizer, é mais do que detecção.

Embora os robôs tenham crescido aos trancos e barrancos em termos de sua capacidade de detectar e identificar objetos em seus arredores, eles ainda têm muito a aprender quando se trata de fazer senso de nível mais alto de seu ambiente.

Como seres humanos, percebemos objetos com um senso intuitivo não apenas de suas formas e rótulos, mas também de sua física – como eles podem ser manipulados e movidos – e como eles se relacionam, seu ambiente maior e de nós mesmos.

Esse tipo de percepção no nível humano é o que Carlone e seu grupo esperam transmitir aos robôs, de maneiras que lhes permitam interagir com segurança e perfeição com pessoas em suas casas, locais de trabalho e outros ambientes não estruturados.

Desde que ingressou no corpo docente do MIT em 2017, Carlone liderou sua equipe no desenvolvimento e aplicação de algoritmos de percepção e entendimento de cenas para várias aplicações, incluindo veículos autônomos de busca e salvamento subterrâneos, drones que podem captar e manipular objetos em tempo real e Carros autônomos. Eles também podem ser úteis para robôs domésticos que seguem comandos de linguagem natural e potencialmente até antecipam as necessidades dos seres humanos com base em pistas contextuais de nível superior.

“A percepção é um grande gargalo para obter robôs para nos ajudar no mundo real”, diz Carlone. “Se pudermos adicionar elementos de cognição e raciocínio à percepção do robô, acredito que eles podem fazer muito bem”.

Expandindo horizontes

Carlone nasceu e foi criado perto de Salerno, Itália, perto da cênica costa de Amalfi, onde era o caçula de três meninos. Sua mãe é professora aposentada do ensino fundamental que ensinou matemática e seu pai é professor de história e editora aposentada, que sempre adotou uma abordagem analítica de sua pesquisa histórica.

Os irmãos podem ter adotado inconscientemente a mentalidade de seus pais, pois os três passaram a serem engenheiros – os dois mais velhos perseguiram eletrônicos e engenharia mecânica, enquanto Carlone desembarcou em robótica ou mecatrônica, como era conhecido na época.

Ele não veio ao campo, no entanto, até o final de seus estudos de graduação. Carlone frequentou a Universidade Politécnica de Turim, onde se concentrou inicialmente no trabalho teórico, especificamente na teoria do controle – um campo que aplica matemática para desenvolver algoritmos que controlam automaticamente o comportamento de sistemas físicos, como grades de energia, planos, carros e robôs.

Então, em seu último ano, Carlone se inscreveu para um curso de robótica que explorou os avanços na manipulação e como os robôs podem ser programados para se mover e funcionar.

“Foi amor à primeira vista. Usar algoritmos e matemática para desenvolver o cérebro de um robô e fazê -lo se mover e interagir com o ambiente é uma das experiências mais gratificantes”, diz Carlone. “Eu imediatamente decidi que é isso que quero fazer na vida.”

Ele passou a um programa de dois graus na Universidade Politécnica de Turim e na Universidade Politécnica de Milão, onde recebeu mestrado em mecatrônica e engenharia de automação, respectivamente.

Como parte deste programa, chamado Alta Scuola Politecnica, Carlone também fez cursos de administração, nos quais ele e estudantes de várias origens acadêmicos tiveram que se unir para conceituar, construir e elaborar um discurso de marketing para um novo design de produto. A equipe de Carlone desenvolveu uma lâmpada de mesa sem toque projetada para seguir os comandos orientados à mão de um usuário. O projeto o levou a pensar em engenharia de diferentes perspectivas.

“Era como ter que falar idiomas diferentes”, diz ele. “Foi uma exposição precoce à necessidade de olhar além da bolha de engenharia e pensar em como criar um trabalho técnico que possa impactar o mundo real”.

A próxima geração

Carlone ficou em Turim para completar seu Ph.D. em mecatrônica. Durante esse período, ele teve liberdade para escolher um tópico de tese, que ele realizou, como lembra: “um pouco ingenuamente”.

“Eu estava explorando um tópico que a comunidade considerou bem compreendida e para a qual muitos pesquisadores acreditavam que não havia mais nada a dizer”, diz Carlone. “Eu subestimei o quão estabelecido o tópico estava e pensei que ainda poderia contribuir com algo novo para ele, e tive a sorte de fazer isso”.

O tópico em questão foi “localização e mapeamento simultâneos” ou slam – o problema de gerar e atualizar um mapa do ambiente de um robô, mantendo simultaneamente o controle de onde o robô está dentro desse ambiente.

Carlone criou uma maneira de reformular o problema, de modo que os algoritmos poderiam gerar mapas mais precisos sem ter que começar com um palpite inicial, como a maioria dos métodos de SLAM fez na época. Seu trabalho ajudou a abrir um campo onde a maioria dos roboticistas pensava que não se poderia fazer melhor do que os algoritmos existentes.

“Slam é descobrir a geometria das coisas e como um robô se move entre essas coisas”, diz Carlone. “Agora faço parte de uma comunidade perguntando: qual é a próxima geração de Slam?”

Em busca de uma resposta, ele aceitou uma posição de pós -doutorado na Georgia Tech, onde mergulhou em codificação e visão computacional – um campo que, em retrospecto, pode ter sido inspirado por um pincel com cegueira: quando ele estava terminando seu doutorado . Na Itália, ele sofreu uma complicação médica que afetou severamente sua visão.

“Por um ano, eu poderia facilmente ter perdido um olho”, diz Carlone. “Isso foi algo que me fez pensar na importância da visão e da visão artificial”.

Ele conseguiu receber bons cuidados médicos e a condição resolvida completamente, de modo que ele pudesse continuar seu trabalho. Na Georgia Tech, seu consultor, Frank Dellaert, mostrou-lhe maneiras de codificar a visão computacional e formular representações matemáticas elegantes de problemas complexos e tridimensionais.

Seu consultor também foi um dos primeiros a desenvolver uma biblioteca de slam de código aberto, chamado GTSAM, que Carlone rapidamente reconheceu como um recurso inestimável. De maneira mais ampla, ele viu que disponibilizar o software para todos desbloqueou um enorme potencial de progresso na robótica como um todo.

“Historicamente, o progresso no SLAM tem sido muito lento, porque as pessoas mantinham seus códigos proprietários e cada grupo teve que começar essencialmente do zero”, diz Carlone. “Então os oleodutos de código aberto começaram a aparecer, e isso foi um divisor de águas, o que impulsionou amplamente o progresso que vimos nos últimos 10 anos”.

AI espacial

Após a Georgia Tech, Carlone chegou ao MIT em 2015 como um pós -doutorado no laboratório para sistemas de informação e decisão (tampas). Durante esse período, ele colaborou com a Sertac Karaman, professor de aeronáutica e astronautica, no desenvolvimento de software para ajudar os drones do tamanho de uma palma a navegar no ambiente usando muito pouca energia a bordo. Um ano depois, ele foi promovido a cientista de pesquisa e, em 2017, Carlone aceitou uma posição no corpo docente em Aerotro.

“Uma coisa pela qual me apaixonei no MIT foi que todas as decisões são motivadas por perguntas como: Quais são nossos valores? Qual é a nossa missão? Nunca se trata de ganhos de baixo nível. A motivação é realmente sobre como melhorar a sociedade”, Carlone diz. “Como mentalidade, isso tem sido muito refrescante.”

Hoje, o grupo de Carlone está desenvolvendo maneiras de representar o ambiente de um robô, além de caracterizar sua forma e semântica geométrica. Ele está utilizando aprendizado profundo e modelos de linguagem grandes para desenvolver algoritmos que permitem que os robôs percebam seu ambiente através de uma lente de nível superior, por assim dizer.

Nos últimos seis anos, seu laboratório lançou mais de 60 repositórios de código aberto, que são usados ​​por milhares de pesquisadores e profissionais em todo o mundo. A maior parte de seu trabalho se encaixa em um campo maior e emergente conhecido como “IA espacial”.

“A IA espacial é como SLAM em esteróides”, diz Carlone. “Em poucas palavras, tem a ver com robôs permitir que pensem e entendam o mundo como os humanos, de maneiras que podem ser úteis”.

É um grande empreendimento que pode ter impactos abrangentes, em termos de permitir robôs mais intuitivos e interativos para ajudar em casa, no local de trabalho, nas estradas e em áreas remotas e potencialmente perigosas. Carlone diz que haverá muito trabalho pela frente, a fim de chegar perto de como os humanos percebem o mundo.

“Eu tenho filhas gêmeas de 2 anos e as vejo manipulando objetos, carregando 10 brinquedos diferentes por vez, navegando em salas desordenadas com facilidade e se adaptando rapidamente a novos ambientes. A percepção do robô ainda não pode corresponder ao que uma criança pode fazer , “Carlone diz. “Mas temos novas ferramentas no arsenal. E o futuro é brilhante”.

Fornecido pelo Instituto de Tecnologia de Massachusetts

Esta história é republicada, cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que abrange notícias sobre pesquisa, inovação e ensino do MIT.

Citação: Expandindo a percepção do robô para dar uma consciência mais humana de seu ambiente (2025, 28 de janeiro) recuperado em 28 de janeiro de 2025 em https://techxplore.com/news/2025-01-robot-perception-human-ancendge-conovelment. html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa particular, nenhuma parte pode ser reproduzida sem a permissão por escrito. O conteúdo é fornecido apenas para fins de informação.



Deixe uma resposta