Se eu lhe disser que existe uma máquina, um robot, um software – chame-lhe o que quiser – que é capaz de transformar uma descrição em linguagem natural numa imagem elaborada e realista, que combina conceitos, atributos e estilos, acredita?
Pense numa imagem de um astronauta montado a cavalo. Mesmo que diga que não tem grande imaginação ou capacidade de abstração, ainda assim, conseguira “gerar” uma imagem mental de: 1. Um astronauta; 2. Montar (pôr em cima de; colocar sobre.); 3. Um cavalo. Isto, porque já viu um astronauta, alguém montado num animal ou veículo e um cavalo.
Então, de forma simplista, é isto que esta nova tecnologia faz: reconhece conceitos, atributos, ações, objetos e sabe como relacioná-los. E o resultado para «Um astronauta montado a cavalo» é este:

Impressionante, não é? Especialmente, se tiver em conta que demorou pouco mais de 10 segundos a gerar esta imagem extremamente realista.
Mas esta tecnologia ainda vai mais longe, pois além de reconhecer conceitos e atributos, também sabe o que são estilos. Assim, se pedir a mesma imagem, mas ao estilo de uma pintura de Andy Warhol, ela devolve-lhe isto:

A tecnologia de que estou a falar chama-se DALL-E 2, um poderoso novo sistema em desenvolvimento de Inteligência Artificial. Este sistema aprendeu a relação entre as imagens e o texto utilizado para as descrever. Utiliza um processo chamado “difusão”, que começa com um padrão de pontos aleatórios e altera gradualmente esse padrão em direção a uma imagem quando reconhece aspetos específicos dessa imagem.

Através de uma aprendizagem profunda não só compreende objetos individuais como astronautas e cavalos, mas também aprende com as relações entre objetos. É por isso que quando se pede à DALL-E uma imagem de um astronauta montado a cavalo, ela sabe como criar isso ou qualquer outra coisa com uma relação com outro objeto ou ação.
Segundo a equipa que desenvolveu (e continua a desenvolver) a DALL-E 2, eles desejam que esta tecnologia permita que as pessoas se expressem de forma criativa. Mas, também que os ajude a compreender como os sistemas avançados de IA veem e compreendem o nosso mundo, o que é fundamental para a sua missão de criar IA que beneficie a humanidade.
Felizmente, a DALL-E 2 não está atualmente à disposição do público. A OpenAI (a organização responsável pelo desenvolvimento desta tecnologia) reconhece que a aplicação poderia ser perigosa se fosse utilizada para criar conteúdos enganadores, semelhantes aos atuais “deepfakes”, ou imagens prejudiciais que pudessem servir para caluniar ou denegrir alguém ou perpetuar e acentuar estereótipos. Imagine-se pedir à DALL-E 2: O Presidente da República Portuguesa de braços espalhafatosamente abertos como quem não vê alguém de que gosta muito faz tempo.

Ok, estou a brincar! Isto prova que a realidade por vezes supera a ficção ou o artificial. Mas, percebeu o perigo de uma utilização maliciosa desta tecnologia.
Como entusiasta de tecnologia e criatividade, não posso deixar de reconhecer o quanto me impressiona e entusiasma esta nova ferramenta. Mas, como criativo, alguém que vive de “converter” conceitos e ideias abstratas em imagens ou sistemas visuais, o meu entusiasmo rapidamente começa a tornar-se em preocupação.
A ideia de simplesmente escrever uma frase e deixar que um programa de computador crie uma imagem relacionada diante dos nossos olhos é algo saído da ficção científica. Nem na famosa série Black Mirror me recordo de algo assim.
Digamos que está a trabalhar num conceito para uma campanha publicitária e que deseja gerar algumas imagens para validar a ideia ou perceber o caminho que esta poderá tomar. Porque não clicar num botão e deixar que a IA crie dezenas de imagens?
Também poderá utilizar esta tecnologia como forma de evitar trabalho desnecessário. Se um cliente quiser ver uma maquete de uma ideia que descreveu, basta clicar num botão e terá vários exemplos.
Ou, porque não democratizar este serviço e incluí-lo num qualquer banco de imagens, em situações em que não se encontra a fotografia ou ilustração perfeita. As possibilidades parecem tornar-se rapidamente infinitas…
Serão as pessoas capazes de distinguir e apreciar entre algo criado por um artista ou designer que admira, ou será que uma versão gerada por IA do conceito funcionará igualmente bem?
Acho que a melhor futurologia é olhando para o passado. Vamos lembrar-nos dos cavalos e de todos os negócios que andavam à sua volta (ferreiros, criadores, tratadores, motoristas de carruagens, ect). Nessa época o cavalo era um bem utilitário e não de luxo. Era um instrumento de trabalho e de transporte. Era barato, fiável e abundante. Com o advento do automóvel e a sua democratização, o cavalo foi posto de parte e rapidamente substituído. Mas ele não desapareceu: continua a existir, mas hoje o seu estatuto é diferente. Não é mais algo utilitário e passou a ser sinónimo de estatuto e riqueza. Ou parte de uma experiência que se quer excecional e memorável, e por isso, altamente valorizada.
Então, que paralelismo é que desejo fazer: é óbvio que a IA irá conquistar rapidamente o seu espaço e substituir muitos criativos, designers, fotógrafos, ilustradores, realizadores, músicos, etc. No extremo, a IA será capaz de produzir “obras” tão ou mais perfeitas e criativas e de gosto abrangente, que os humanos não conseguirão competir. E mesmo que não chegue a estes níveis de qualidade, para uma parte substancial da população, estas criações serão suficientemente boas para serem apreciadas e desejadas. O acesso a este serviço será barato e conveniente.
No entanto, continuará a existir procura por trabalho manual, feito por mãos e mente humana. Esse trabalho será hiper-valorizado, não porque compete por uma qualidade, criatividade e originalidade excecional, mas porque é feito por uma pessoa – ou porque é feito por aquela pessoa específica. O desafio será construir uma reputação que permita essa valorização.
Muitos designers, fotógrafos, músicos, artistas em geral irão transformar-se em artesãos: um profissional que fabrica produtos em pequena escala, através de um processo manual ou com auxílio de ferramentas, sendo que a sua profissão requer algum tipo de habilidade ou conhecimento especializado na sua prática. Serão obras altamente valorizadas e para um nicho de mercado.
Mas, tal com disse acima, isto é futurologia. Embora a IA continue a evoluir de forma vertiginosa, ainda há muito trabalho e discussão.
Até lá, continuemos a dar “asas à imaginação” e forma às imagens que imaginamos.