Make-A-Scene segue passos de Dall-E e Imagen, mas permite que usuário desenhe como deve ser a imagem criada; Meta ainda não liberou ferramenta.
Modelos de inteligência artificial para criar imagens parecem ser a mais nova tendência no setor. O Dall-E da OpenAI e o Imagen do Google são dois exemplos de algoritmos desse tipo. Eles transformam descrições em desenhos e montagens sem que o usuário precise dominar ferramentas de arte. A mais nova empresa a entrar nesse ramo é a Meta. A divisão de IA da empresa criou o Make-A-Scene, mas ele tem uma diferença em relação aos concorrentes.
Enquanto Dall-E e Imagen permitem apenas descrições em texto, o Make-A-Scene combina o que o usuário escreve com o que ele desenha.
Sim, o modelo também entende imagens. Assim, o usuário pode rabiscar um rascunho, e o programa se encarrega de fazer o resto da arte.
Controlar e dar forma
No exemplo compartilhado por Mark Zuckerberg, CEO da Meta, no Instagram, o usuário escreveu “uma pintura de um bicho-preguiça descendo de esqui uma montanha nevada”.
Ele também fez um desenho geral de como deveria ser a cena: o bicho-preguiça virado para a esquerda da tela, a montanha subindo à direita, o ângulo de descida praticamente diagonal. As oito imagens geradas seguem o layout montado pelo usuário.
“Para perceber o potencial da inteligência artificial em levar adiante a expressão criativa, as pessoas devem poder controlar e dar forma ao conteúdo que um sistema gera”, escreveu Zuckerberg.
Sucesso nos testes
Por enquanto, o Make-A-Scene não está disponível para o público geral, então não dá para ver como isso funciona na prática. Nos testes, avaliadores humanos tiveram que comparar imagens criadas usando textos e desenhos com aquelas que se baseavam apenas nos textos.
Quando a referência era um rascunho de desenho, o modelo da Meta foi escolhido 99,54% das vezes — um número impressionante. Quando a referência era apenas a descrição, este número caía para 66%.
Agora, o algoritmo ficará nas mãos de artistas digitais como Sofia Crespo, Scott Eaton, Alexander Reben e Refik Anadol, que vão testar a ferramenta e dar feedback sobre os resultados.
IA de geração de imagens viralizou
As inteligências artificiais usadas para criar imagens ganharam destaque nos últimos meses.
O Dall-E Mini, uma versão limitada do Dall-E 2 da OpenAI, foi disponibilizado ao público e caiu nas graças dos usuários do Twitter e do Reddit.
Montagens engraçadas, esquisitas, bizarras e até assustadoras começaram a surgir nas redes e viralizaram. Entre as criações, teve Darth Vader tocando guitarra e Caco, o Sapo, em uma releitura do quadro “O Grito”, de Edvard Munch.
Com informações: Meta, Engadget.
Fonte: Tecnoblog