O
MidJourney já era um dos geradores de imagens de IA mais impressionantes do mercado e, com o lançamento da versão 5.1, ficou muito mais poderoso. A actualização do algoritmo significa que, mesmo para principiantes, é agora incrivelmente fácil criar obras de arte espantosas com o mínimo de esforço – e deepfakes. Muitos e muitos deepfakes.
O gerador de imagens com IA entrou na consciência pública no mês passado, depois de se terem tornado virais as imagens deepfake do Papa Francisco com um casaco branco. A controvérsia deu origem a conversas sobre a ética dos geradores de IA como o MidJourney, e a empresa tomou medidas pouco depois.
O uso da palavra “pope” no MidJourney foi banido, mas a criação de deepfakes de outras pessoas, como o Presidente Joe Biden, continua a ser permitida – provavelmente até vermos uma imagem viral de Biden a usar um fato de spandex cor-de-rosa neon a fazer ioga na Sala Oval.
Ou talvez uma de Biden a usar um fato de espartano intergaláctico que se parece um pouco com o Homem de Ferro.
O
MidJourney também permite aos utilizadores criar deepfakes de alta qualidade utilizando fotografias como referência. Esta funcionalidade aumentou significativamente a popularidade do MidJourney devido aos resultados impressionantes que proporciona e à sua baixa curva de aprendizagem. Neste momento, é o modelo de imagem de IA mais popular em termos de interesse dos utilizadores, ultrapassando o Dall-e e o Stable Diffusion.
A última actualização do MidJourney promete melhorias na forma como o algoritmo interpreta as indicações dos utilizadores. A versão 5.0 foi lançada há apenas três meses e marcou uma mudança significativa em relação à versão 4.
A
V5.1 já está disponível! As imagens são mais coerentes, nítidas e bonitas. É mais fácil de utilizar e deverá responder com mais precisão às instruções. Também adicionámos um modo “RAW” para utilizadores experientes, para reduzir a “opinião” do nosso modelo e dar-lhe mais controlo criativo.
– Midjourney (@midjourney) May 3, 2023
Este novo modelo oferece uma maior coerência, mais exactidão nas instruções de texto, menos margens indesejadas ou artefactos de texto (as coisas estranhas e aleatórias que por vezes aparecem nas imagens) e resultados mais nítidos em geral, de acordo com a MidJourney. A cereja no topo do bolo é o facto de a nova versão ter sido treinada para ser mais “opinativa”.
Ser opinativo significa que o modelo tem a liberdade de ser mais criativo ao interpretar o pedido de um utilizador. Isto resulta em melhores imagens com pedidos básicos – mesmo com comandos absurdos de apenas uma ou duas palavras.
Por exemplo, a simples comparação dos resultados dos comandos “Bitcoin Wallet” utilizando as versões 5.1 e 5.0 demonstra as diferenças e melhorias. A versão 5.1 imagina uma carteira de couro, com um logotipo de bitcoin bordado e colocada sobre uma mesa. A versão 5 mostra simplesmente uma carteira com um Bitcoin numa superfície lisa.
A nova versão reforça ainda mais os pontos fortes que levaram à explosão do MidJourney, sem esquecer os utilizadores experientes que dispõem agora de um modo RAW se quiserem resultados mais precisos e menos “opinativos”.
E as mãos com muitos dedos? O MidJourney v5.1 foi muito melhorado. As representações de mãos são agora bem sucedidas na maioria dos casos, embora o gerador ainda produza alguns erros.
A equipa do MidJourney diz que poderemos ver a versão 5.2 no futuro, melhorando ainda mais as capacidades desta ferramenta. Se à terceira vez for de vez, então os dias em que os geradores de IA estragam as mãos nos nossos deepfakes favoritos podem finalmente ter ficado para trás.
*** Translated with www.DeepL.com/Translator (free version) ***