Transforme textos em imagens com a nova IA do Google
Já pensou descrever um cenário e o computar desenhar para você?
O Google Research revelou o Imagen, uma nova inteligência artificial (IA) que traduz texto em imagem. Basicamente, o sistema pode criar imagens fotorrealistas a partir de entradas de texto.
“Apresentamos o Imagen, um modelo de difusão de texto para imagem com um grau de fotorrealismo sem precedentes e um profundo nível de compreensão da linguagem”, diz o artigo oficial. “Imagen baseia-se no poder de grandes modelos de transformação de linguagem na compreensão de textos e depende da força dos modelos de difusão na geração de imagens de alta fidelidade.’
“Um grau de realismo sem precedentes”
O Google afirma que o Imagen apresenta um grau de fotorrealismo sem precedentes e um profundo nível de compreensão da linguagem que supera concorrentes. Para funcionar, o programa recebe textos, digamos: “Três esferas de vidro caindo no oceano. A água está espirrando. Sol está se pondo.” e a transforma em uma imagem que retrata exatamente isso. As imagens resultantes podem ser fotorrealistas ou mais uma interpretação artística.
O Imagen não está disponível ao público, mas o Google compartilhou vários exemplos de como a IA funciona. Para o projeto, o Google criou um benchmark abrangente e desafiador para o modelo chamado DrawBench. Com ele, a empresa pode comparar o Imagen com outros métodos de IA, como o VQ-GAN+CLIP, Modelos de difusão latente e DALL-E 2. O DrawBench descobriu que os humanos preferem o Imagen aos concorrentes.
Para saber mais sobre o Imagen, acesse aqui onde o Google explica o projeto em profundidade.
*Via Designboom