Cientistas criam nova técnica para gerar hologramas mais rápido do que qualquer GPU

Os pesquisadores propõem uma nova abordagem que utiliza aprendizado profundo para gerar hologramas tridimensionais a partir de imagens bidimensionais coloridas – mais rápido do que uma “unidade de processamento gráfico de última geração”

Os hologramas há muito que prometem oferecer experiências tridimensionais (3D) imersivas, mas os desafios envolvidos na sua geração limitaram a sua utilização generalizada.

Aproveitando os recentes desenvolvimentos na aprendizagem profunda, investigadores da Universidade de Chiba propõem agora o que consideram ser “uma abordagem revolucionária” que utiliza redes neurais para transformar imagens coloridas bidimensionais comuns em hologramas 3D.

Os pesquisadores dizem que a abordagem proposta pode simplificar a geração de hologramas 3D e pode encontrar aplicações em vários campos, incluindo saúde e entretenimento.

Hologramas que oferecem uma visão tridimensional (3D) de objetos fornecem um nível de detalhe que é inatingível por imagens bidimensionais (2D) regulares.

Devido à sua capacidade de oferecer uma experiência realista e imersiva de objetos 3D, os hologramas possuem um enorme potencial para uso em vários campos, incluindo imagens médicas, fabricação e realidade virtual.

Os hologramas são tradicionalmente construídos registrando os dados tridimensionais de um objeto e as interações da luz com o objeto.

No entanto, esta técnica é computacionalmente altamente intensiva, pois requer o uso de uma câmera especial para capturar as imagens 3D. Isto torna a geração de hologramas um desafio e limita a sua utilização generalizada.

Recentemente, muitos métodos de aprendizagem profunda também foram propostos para gerar hologramas. Eles podem criar hologramas diretamente a partir dos dados 3D capturados usando câmeras RGB-D que capturam informações de cor e profundidade de um objeto.

Esta abordagem contorna muitos desafios computacionais associados ao método convencional e representa uma abordagem mais fácil para gerar hologramas.

Agora, uma equipe de pesquisadores liderada pelo professor Tomoyoshi Shimobaba, da Escola de Pós-Graduação em Engenharia da Universidade de Chiba, no Japão, propõe uma nova abordagem baseada em aprendizado profundo que agiliza ainda mais a geração de hologramas, produzindo imagens 3D diretamente de imagens coloridas 2D regulares capturadas usando câmeras comuns. .

Yoshiyuki Ishii e Tomoyoshi Ito, da Escola de Pós-Graduação em Engenharia da Universidade de Chiba, também fizeram parte deste estudo, que foi disponibilizado online em agosto, em Óptica e Lasers em Engenharia.

Explicando a lógica por trás deste estudo, o Professor Shimobaba afirma: “Existem vários problemas na realização de exibições holográficas, incluindo a aquisição de dados 3D, o custo computacional dos hologramas e a transformação de imagens holográficas para corresponder às características de um dispositivo de exibição holográfica.

“Realizamos este estudo porque acreditamos que o aprendizado profundo se desenvolveu rapidamente nos últimos anos e tem potencial para resolver esses problemas.”

A abordagem proposta emprega três redes neurais profundas (DNNs) para transformar uma imagem colorida 2D regular em dados que podem ser usados ​​para exibir uma cena ou objeto 3D como um holograma.

O primeiro DNN utiliza como entrada uma imagem colorida capturada usando uma câmera normal e então prevê o mapa de profundidade associado, fornecendo informações sobre a estrutura 3D da imagem.

Tanto a imagem RGB original quanto o mapa de profundidade criado pela primeira DNN são então utilizados pela segunda DNN para gerar um holograma. Finalmente, o terceiro DNN refina o holograma gerado pelo segundo DNN, tornando-o adequado para exibição em diferentes dispositivos.

Os pesquisadores descobriram que o tempo gasto pela abordagem proposta para processar dados e gerar um holograma era “superior ao de uma unidade de processamento gráfico de última geração”.

O professor Shimobaba afirma: “Outro benefício digno de nota da nossa abordagem é que a imagem reproduzida do holograma final pode representar uma imagem reproduzida em 3D natural.

“Além disso, como as informações de profundidade não são usadas durante a geração do holograma, esta abordagem é barata e não requer dispositivos de imagem 3D, como câmeras RGB-D, após o treinamento.”

Num futuro próximo, esta abordagem poderá encontrar aplicações potenciais em heads-up e head-mounted displays para gerar displays 3D de alta fidelidade.

Da mesma forma, pode revolucionar a geração de um head-up display holográfico no veículo, que poderá apresentar as informações necessárias sobre pessoas, estradas e sinais aos passageiros em 3D.

Espera-se, portanto, que a abordagem proposta abra caminho para aumentar o desenvolvimento da tecnologia holográfica onipresente.

Versão para impressão, PDF e e-mail

Deixe uma resposta