Engenheiros aceleram o tempo de resposta dos robôs para reagir à conversa humana

Engenheiros aceleram o tempo de resposta dos robôs para reagir à conversa humana

Configuração do microfone no REEM-C. Crédito: PLOS UM (2024). DOI: 10.1371/journal.pone.0296452

Falar com um robô muitas vezes parece artificial ou atrasado, graças ao software de computador que tenta acompanhar a conversa. No entanto, uma nova pesquisa da Universidade de Waterloo melhorou a capacidade dos humanos de se comunicarem naturalmente com robôs humanóides.

Os pesquisadores de Waterloo conseguiram resolver como um robô humanóide pode identificar a direção de onde vinha a fala humana, reorientar-se para rastrear essa voz para criar uma conversa mais realista e acelerar seu tempo de reação para se comunicar com sua contraparte humana.

“Criar conversas mais naturais com robôs humanóides é um desafio interessante porque a fala é fundamental para as nossas interações sociais”, disse Ewen MacDonald, professora do Departamento de Engenharia de Design de Sistemas de Waterloo e membro da equipe de pesquisa.






Crédito: Universidade de Waterloo

A equipe de pesquisa construiu um sistema auditivo para um robô humanóide usando dois microfones onde os ouvidos de um humano normalmente ficariam para ajudar a gerar uma estimativa da direção de onde vinham os sons de áudio. Os sons produzidos por seres humanos e outras fontes acústicas são refletidos por superfícies como objetos ou paredes.

Um pipeline de processamento de sinal é necessário para dar conta desses reflexos, pois eles podem enganar incorretamente os robôs humanóides sobre a origem do som. Para que um robô reaja tão rapidamente quanto um ser humano reagiria sonoramente, o computador do robô precisa gerar essa localização estimada com extrema rapidez.

A pesquisa de Waterloo desenvolve uma estrutura que pode otimizar a velocidade de processamento do robô e caracterizar diferentes sons com base no desempenho geral e na latência. Os testes no robô humanóide usaram a estrutura com gravações em diversos ambientes acústicos.

Como ter uma conversa mais natural com um robô

Exemplo de dois sinais de microfone simulados. Visualização dos sinais y1 (azul) e y2 (laranja). Crédito: PLOS UM (2024). DOI: 10.1371/journal.pone.0296452

Pranav Barot, estudante de pós-graduação em Design de Sistemas que trabalhou no artigo de pesquisa, disse que a equipe foi motivada pelo desejo de testar as capacidades de robôs humanóides capazes de ouvir e interagir com humanos em tempo real. Um grande desafio da pesquisa foi testar como o robô se reorienta para ouvir os humanos em espaços grandes, barulhentos ou lotados.

“As implicações desta pesquisa são importantes em qualquer cenário ou ambiente onde robôs humanóides trabalhem em conjunto com seres humanos, tanto em situações robóticas sociais ou onde humanos e robôs trabalhem juntos”, disse Barot.

A pesquisa está publicada na revista PLOS UM.

Mais Informações:
Pranav Barot et al, Estimando a direção do alto-falante em um robô humanóide com sinais acústicos binaurais, PLOS UM (2024). DOI: 10.1371/journal.pone.0296452

Fornecido pela Universidade de Waterloo

Citação: Os engenheiros aceleram o tempo de resposta dos robôs para reagir à conversa humana (2024, 11 de abril) recuperado em 11 de abril de 2024 em https://techxplore.com/news/2024-04-quicken-response-robots-react-human.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.



Deixe uma resposta