Continua após publicidade

Transforme textos em imagens com a nova IA do Google

Já pensou descrever um cenário e o computar desenhar para você?

Por Redação
2 jun 2022, 19h00
Série de 8 imagens criadas a partir de textos que constam nas legendas delas.
(Imagen/Google Research/Google)

O Google Research revelou o Imagen, uma nova inteligência artificial (IA) que traduz texto em imagem. Basicamente, o sistema pode criar imagens fotorrealistas a partir de entradas de texto.

“Apresentamos o Imagen, um modelo de difusão de texto para imagem com um grau de fotorrealismo sem precedentes e um profundo nível de compreensão da linguagem”, diz o artigo oficial. “Imagen baseia-se no poder de grandes modelos de transformação de linguagem na compreensão de textos e depende da força dos modelos de difusão na geração de imagens de alta fidelidade.’

“Um grau de realismo sem precedentes”

Imagem de um guaxinim de chapéu andando de skate. Ao lado o texto a partir do qual a imagem foi criada, com frases descritivas em destaque.
(Imagen/Google Research/Google)

O Google afirma que o Imagen apresenta um grau de fotorrealismo sem precedentes e um profundo nível de compreensão da linguagem que supera concorrentes. Para funcionar, o programa recebe textos, digamos: “Três esferas de vidro caindo no oceano. A água está espirrando. Sol está se pondo.” e a transforma em uma imagem que retrata exatamente isso. As imagens resultantes podem ser fotorrealistas ou mais uma interpretação artística.

Série de 4 imagens criadas a partir de textos que constam nas legendas delas.
(Imagen/Google Research/Google)

O Imagen não está disponível ao público, mas o Google compartilhou vários exemplos de como a IA funciona. Para o projeto, o Google criou um benchmark abrangente e desafiador para o modelo chamado DrawBench. Com ele, a empresa pode comparar o Imagen com outros métodos de IA, como o VQ-GAN+CLIP, Modelos de difusão latente e DALL-E 2. O DrawBench descobriu que os humanos preferem o Imagen aos concorrentes.

Imagem de um pequeno cacto de chapéu de palha, usando óculos de sol neon no deserto do Sahara. Abaixo consta o texto a partir do qual a imagem foi gerada. A imagem bate certinho com o texto.
(Imagen/Google Research/Google)

Para saber mais sobre o Imagen, acesse aqui onde o Google explica o projeto em profundidade.

*Via Designboom

Publicidade