Topo

Pedro e Paulo Markun

OPINIÃO

Texto em que o autor apresenta e defende suas ideias e opiniões, a partir da interpretação de fatos e dados.

IA transformou nossas palavras em imagens. Funcionou, menos com Bolsonaro

A inteligência artificial DALL-E criou esta imagem a partir da descrição "astronauta montado no cavalo em estilo fotorrealista" - Reprodução/ openai.com/dall-e-2
A inteligência artificial DALL-E criou esta imagem a partir da descrição "astronauta montado no cavalo em estilo fotorrealista" Imagem: Reprodução/ openai.com/dall-e-2

Pedro e Paulo Markun

Colunistas do UOL

10/10/2022 04h00

Receba os novos posts desta coluna no seu e-mail

Email inválido

A notícia é ótima para quem quer experimentar as possibilidades da inteligência artificial nas artes visuais: na semana passada, a Open AI, empresa que desenvolveu a ferramenta DALL-E, acabou com a fila de espera e passou a permitir que qualquer pessoa use a ferramenta para criar imagens sem interferência humana.

O número de usuários já passou de 1,5 milhão e, todos os dias, eles criam mais de 2 milhões de imagens a partir da inteligência artificial via DALL-E.

Os usuários que se inscreverem receberão 50 créditos gratuitos para criar imagens durante o primeiro mês e 15 créditos gratuitos todos os meses depois disso.

Esse gerador de imagens começou a operar em versão beta em abril deste ano e rapidamente formou-se a imensa fila de espera. O nome é uma homenagem meio enviesada a Salvador Dali e ao robô WALL-E, do filme da Pixar.

Não é o único sistema do gênero: há também a Midjourney, com centenas de milhares de usuários pendurados em sua plataforma baseada no Discord e a StabilityAI, criadora do gerador de arte de IA Stable Diffusion, que —sendo de código aberto— é muito mais flexível e pode ser utilizado e apropriado para os mais diversos fins.

Dentre os três, o DALL-E é talvez o mais restritivo e tenta controlar certos usos de seu sistema.

A compreensão da empresa é que essa tecnologia nascente precisa ser disponibilizada com atenção e responsabilidade, sob o risco de ser mal utilizada pelas pessoas. Por isso, certas palavras, como "adolescente" e "pré-adolescente" são de uso limitado, assim como qualquer tentativa de gerar pornografia e editar fotografias de pessoas existentes.

Mas há problemas.

Um pedido de desenvolver "uma foto de um pato coberto de sangue" será recusado, mas diante de outra frase, aparentemente inócua, o computador reagirá —é o caso de um prompt do tipo "uma foto de um pato coberto por um líquido vermelho viscoso".

No fim das contas é preciso um outro sistema de inteligência artificial para controlar quais prompts (ou pedidos) são ou não permitidos.

A utilização da DALL-E demanda um certo aprendizado, para chegarmos a resultados aproveitáveis. Mas as tentativas e os erros são, pelo menos, divertidos.

Ao tentar criar imagens usando figuras públicas brasileiras, os colunistas se depararam com resultados curiosos.

Não é possível construir um quadro impressionista de Jair Bolsonaro —aparece a mensagem de que este é um movimento que contraria a política da empresa.

Dall-e bolsonaro impressionista - Reprodução - Reprodução
Imagem: Reprodução

Mas é possível "desenhar" uma imagem impressionista de Caetano Veloso.

Embora o resultado pouco tenha a ver com o cantor, é de se admirar que a inteligência artificial desenhe um cantor —comprovando que ele entende algo do que foi pedido.

dall-e caetano veloso impressionista - Reprodução - Reprodução
Imagem: Reprodução

O DALL-E é particularmente bom, comparado com os outros, para gerar rostos e pessoas, algo que é tão notadamente difícil no campo que tem até um fenômeno próprio chamado de "uncanny valley" ou "vale da estranheza". É assim que os especialistas chamam esse espaço entre uma imagem "realista" e outro que é "quase tão realista" que nos causa certo estranhamento.

Mas o nosso pintor artificial não está limitado apenas a personalidades. Aliás, tirando as fronteiras artificiais inseridas pela própria empresa, não existem realmente limites daquilo que pode ser pedido.

Isso gera pedidos inusitados como, por exemplo:

"Polaroid shot de um pinguim com roupa de turista visitando as pirâmides de Gizé nas férias."

dall-e - Polaroid shot de um pinguim com roupa de turista visitando as pirâmides de Gizé nas férias - Reprodução - Reprodução
Imagem: Reprodução

Ou ser usado como fonte de inspiração para indústrias criativas, como o design de móveis:

"Um sofá bem confortável, inspirado no movimento hippie. Peça conceitual."

dall-e - Um sofá bem confortável, inspirado no movimento hippie. Peça conceitual - Reprodução - Reprodução
Imagem: Reprodução

Ou joias:

dall-e - joias - Reprodução - Reprodução
Imagem: Reprodução

A ferramenta é viciante e, não fossem os créditos limitados, poderíamos passar horas explorando as possibilidades.

Para Pedro, não existe nenhuma dúvida de que essa tecnologia vai mudar completamente a forma como produzimos e consumimos —arte, entretenimento, conteúdo— e é uma revolução tão ou mais profunda que o surgimento da tinta a óleo, fotografia e a imprensa de Gutenberg.

Toda a indústria criativa será profundamente transformada a medida em que essa tecnologia se desenvolva, democratize e seja incluída nos fluxos de produção dos designers, artistas e criadores mundo afora.

Paulo acha que a ferramenta ainda exige criatividade e talento por parte dos usuários, o que não é mau negócio. Principalmente para quem, como ele, sempre foi um zero à esquerda nas artes, por incapaz de desenhar qualquer coisa que não um carro ou uma casa daquelas tradicionais.

Só o futuro dirá (e esta coluna, idealmente, irá acompanhar).

Enquanto isso, esses colunistas o convidam para acessar o site e criar um pouco desse futuro.

E deixam vocês com uma última imagem:

"DALL-E desenhado por DALL-E"

DALL-E desenhado por DALL-E - Reprodução - Reprodução
Imagem: Reprodução