O novo gerador de imagens DALL-E 3 é uma grande atualização - com proteções

OpenAI, o unicórnio por detrás do boom da indústria de IA generativa, revelou o DALL-E 3, a mais recente iteração do seu gerador de imagens. Com o seu controlador ChatGPT, a atualização fornece imagens de alta qualidade em resposta a solicitações de linguagem natural – e é lançada com controlos éticos em vigor.

Geradores de imagens como DALL-E, MidJourney e Stable Diffusion abriram novas fronteiras criativas para artistas e utilizadores casuais desde o boom da IA no final do ano passado. Ao traduzir instruções de texto em imagens espectaculares, oferecem vislumbres de interpretações automáticas da criatividade humana. Agora, a OpenAI pretende alargar ainda mais os limites com o DALL-E 3, um modelo que poderá colocá-la de novo em concorrência direta com outros líderes da indústria.

Revelado hoje cedo, o DALL-E 3 demonstra grandes melhorias na representação exacta de descrições textuais detalhadas. Ao contrário das iterações anteriores, ele segue à risca as instruções complexas sem precisar de grandes ajustes na engenharia de instruções ou outros truques complicados. O novo sistema também é excelente na captura de relações entre objectos e na geração de detalhes humanos fotorrealistas, como mãos e reflexos.

O nosso novo modelo de texto para imagem, o DALL-E 3, consegue traduzir pedidos com nuances em imagens extremamente detalhadas e precisas.

Brevemente no ChatGPT Plus & Enterprise, que o pode ajudar a criar prompts fantásticos para dar vida às suas ideias:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL

– OpenAI (@OpenAI) 20 de setembro de 2023

Quando se comparam as saídas dos mesmos prompts no DALL-E 2 e no DALL-E 3, o último produz imagens nitidamente mais nítidas e precisas. Ele pode renderizar representações extremamente realistas de cenas, ao mesmo tempo em que acerta as texturas, a iluminação e os fundos. E parece bastante capaz de gerar texto e integrá-lo nas imagens – algo que continua a ser um problema até para os geradores de imagens de IA mais poderosos até à data.

O DALL-E 3 é construído sobre o ChatGPT, permitindo aos utilizadores refinarem iterativamente as mensagens através de conversas. As primeiras amostras que vazaram sugerem capacidades de iteração incrivelmente rápidas. Como TCN relatou anteriormente, o YouTuber MattVidPro chamou um beta anterior do DALL-E 3 de “insano” e afirmou que nem mesmo a próxima versão do MidJourney poderia competir.

No entanto, a disponibilidade permanece limitada a cerca de 400 testadores e a OpenAI diz que seu novo modelo será lançado “em breve”.

Uma imagem criada com o DALL-E 3 e a linguagem de alerta utilizada no processo. Fonte: OpenAI

Por enquanto, os utilizadores podem criar imagens com o DALL-E 2 utilizando plugins com o ChatGPT Plus. Aqueles que não pagarem por uma subscrição terão de lidar com restrições como esta:

A jornada até este ponto não foi isenta de obstáculos. Durante a fase de testes beta, o modelo destacou-se pela sua natureza sem censura, capaz de gerar conteúdos que iam desde a nudez ao sangue e à violência. Este facto levantou suspeitas e suscitou preocupações sobre a potencial utilização indevida deste tipo de tecnologia. Mas a OpenAI parece ter levado essas preocupações a sério, implementando características no DALL-E 3 que impedem a geração de conteúdo que possa ser considerado violento, adulto ou de ódio, garantindo uma experiência mais segura para o utilizador.

Uma dessas medidas é a reunião de uma equipa de especialistas “para ajudar a informar os nossos esforços de avaliação e mitigação de riscos em áreas como a propaganda e a desinformação”.

As preocupações em torno da arte da IA persistem, especialmente em relação a conteúdos inadequados ou antiéticos. Embora o OpenAI tenha removido os filtros durante os testes, a empresa está a explorar estratégias para evitar o uso indevido em versões públicas. Também facilitará a identificação de imagens geradas com a sua ferramenta. Isto poderia evitar a propagação de deepfake e potencialmente identificar a origem de uma imagem no caso de alguém contornar a censura nativa do modelo.

A OpenAI também está ciente das preocupações sobre o uso legal de obras de arte humanas para treinar o seu modelo e encontrou uma resposta para um gerador mais ético. O DALL-E 3 não reproduzirá conteúdos quando lhe for pedido que imite artistas vivos, e a OpenAI permitirá que os criadores optem por não o fazer. Isto responde às reacções de artistas como Greg Rutkowski, que argumentam que a IA copiar o seu estilo sem consentimento não é ético.

Foram também intentadas acções judiciais importantes, incluindo a do autor George R.R. Martin, que acusa a OpenAI de utilização indevida de material protegido por direitos de autor.

A OpenAI não respondeu imediatamente a um pedido de comentários do TCN.

O novo gerador de imagens DALL-E 3 é uma grande atualização – com proteções

O aplicativo Fintech Eco apoiado por Andreessen ‘dobra para baixo’ na criptografia sem custódia

Após tentativa fracassada de recuperar a empresa homónima, Ben ‘Bitboy’ Armstrong pede dinheiro aos fãs

Related Posts

Leave a Comment Cancel Reply