Se o Imagen AI estiver incluído, as possibilidades de expressão são infinitas
O Gboard do Google é facilmente um dos melhores aplicativos de teclado disponíveis no Android hoje e por todos os bons motivos. Além do teclado completo, o aplicativo inclui gestos convenientes para mover o cursor ou selecionar texto e modos de expressão adequados por meio de uma enorme biblioteca de emojis. Se os caracteres padrão aprovados pelo Unicode Consortium não forem suficientes, você pode preparar algumas combinações selvagens com Emoji Kitchen. Agora estamos aprendendo os planos do Google de integrar IA fotorrealista chamada Imagen para ajudar na expressão criativa.
Se você não estiver familiarizado, o Imagen é um dos projetos de pesquisa do Google lançados em maio de 2022. Ele usa IA para converter prompts de texto em imagens fotorrealistas, muito parecido com as ferramentas populares DALL-E 2 e Midjourney. O modelo AI compreende um codificador de texto, um modelo de difusão de texto para imagem e um modelo de difusão de aprimoramento de resolução. Ao vasculhar as cadeias de código na última versão beta do Gboard (v12.7.05.507749191), o 9to5Google relata que encontrou referências a um “teclado de imagens”. Isso pode ser um sinal da próxima integração do Imagen com o Gboard. Provavelmente, o Imagen poderia ser adicionado na seção Atalhos do Gboard com opções como configurações de tema, um seletor de GIF e integração com o Google Tradutor.
As chances dessa nova integração de IA chegar até nós não parecem absurdas. Há meses, o Google vem trabalhando em maneiras de integrar IA em seus serviços, como ficou claro no evento surpresa em que um chatbot de conversação chamado Bard foi apresentado. No entanto, o Google Research expressou algumas preocupações com o uso público do Imagen.
O modelo AI ainda não está disponível publicamente porque o Google teme que as pessoas possam fazer mau uso dele. Veja bem, a IA do Imagen também foi treinada usando conjuntos de dados contendo material pornográfico e imagens extraídas da web, ambos contendo (pelo menos subconjuntos de) conteúdo impróprio. Se o Imagen usar os dados, os resultados podem ofender certas comunidades ou parecer racistas e estereotipados.
O Google promete garantir que as salvaguardas estejam em vigor antes que o Imagen seja lançado para as massas, mas isso pode levar um tempo não especificado. Pelo lado positivo, o Imagen também tem uma enorme vantagem – ele depende de modelos de difusão que funcionam de maneira ideal mesmo em hardware portátil como smartphones sem afetar significativamente o desempenho ou a duração da bateria. Os resultados permanecem fiéis às instruções do texto, saindo-se admiravelmente bem nas avaliações feitas por humanos. Portanto, não estamos muito surpresos que o Gboard se beneficie de mais integração de IA no futuro. Até que o Google descubra os detalhes técnicos, você pode confiar no Emoji Kitchen para alguns personagens de outro mundo.