Home » Il nuovo generatore di immagini DALL-E 3 è un grande aggiornamento, con tanto di guardrail

Il nuovo generatore di immagini DALL-E 3 è un grande aggiornamento, con tanto di guardrail

by Patricia

OpenAI, l’unicorno dietro il boom dell’industria dell’IA generativa, ha presentato DALL-E 3, l’ultima iterazione del suo generatore di immagini. Con il suo controller ChatGPT, l’aggiornamento fornisce immagini di altissima qualità in risposta a richieste in linguaggio naturale, e si avvia con controlli etici in atto.

Generatori di immagini come DALL-E, MidJourney e Stable Diffusion hanno aperto nuove frontiere creative per gli artisti e gli utenti occasionali dopo il boom dell’IA alla fine dello scorso anno. Traducendo le richieste di testo in immagini sorprendenti, offrono scorci di interpretazione automatica della creatività umana. Ora OpenAI punta a spingersi oltre con DALL-E 3, un modello che potrebbe rimetterla in competizione diretta con gli altri leader del settore.

Presentato oggi in anteprima, DALL-E 3 dimostra enormi miglioramenti nella rappresentazione accurata di descrizioni testuali dettagliate. A differenza delle precedenti iterazioni, aderisce strettamente alle richieste complesse senza richiedere enormi modifiche alla progettazione delle richieste o altri complicati trucchi per le richieste. Il nuovo sistema eccelle anche nella cattura delle relazioni tra gli oggetti e nella generazione di dettagli umani fotorealistici come mani e riflessi.

Quando si confrontano gli output degli stessi prompt in DALL-E 2 e DALL-E 3, quest’ultimo produce immagini nettamente più nitide e precise. È in grado di produrre rappresentazioni estremamente realistiche delle scene, con texture, illuminazione e sfondi corretti. Sembra inoltre in grado di generare testo e di integrarlo nelle immagini, cosa che rimane un problema anche per i generatori di immagini AI più potenti.

DALL-E 3 è costruito sulla base di ChatGPT, che consente agli utenti di perfezionare iterativamente i suggerimenti attraverso gli scambi di conversazione. I primi campioni trapelati lasciano intendere una capacità di iterazione incredibilmente veloce. Come riportato in precedenza da TCN, lo YouTuber MattVidPro ha definito una prima beta di DALL-E 3 “pazzesca” e ha affermato che nemmeno la prossima versione di MidJourney potrebbe competere.

Tuttavia, la disponibilità rimane strettamente limitata a circa 400 tester e OpenAI afferma che il suo nuovo modello sarà rilasciato “presto”.

Un'immagine creata con DALL-E 3 e il linguaggio di richiesta utilizzato nel processo. Fonte: OpenAI

Un’immagine creata con DALL-E 3 e il linguaggio di richiesta utilizzato nel processo. Fonte: OpenAI


Per ora gli utenti possono creare immagini con DALL-E 2 utilizzando i plugin con ChatGPT Plus. Chi non paga l’abbonamento dovrà fare i conti con restrizioni come questa:


Il viaggio per arrivare a questo punto non è stato privo di ostacoli. Durante la fase di beta testing, il modello è stato notato per la sua natura non censurata, in grado di generare contenuti che andavano dalla nudità al gore e alla violenza. Questo ha sollevato delle perplessità e ha suscitato preoccupazioni per il potenziale uso improprio di questa tecnologia. Ma OpenAI sembra aver preso a cuore queste preoccupazioni, implementando in DALL-E 3 funzioni che impediscono la generazione di contenuti che potrebbero essere considerati violenti, per adulti o di odio, garantendo un’esperienza utente più sicura.

Una di queste misure è la costituzione di un team di esperti “che ci aiuterà ad informare la nostra valutazione del rischio e gli sforzi di mitigazione in aree come la propaganda e la disinformazione”.

Le preoccupazioni legate all’arte dell’IA persistono, soprattutto per quanto riguarda i contenuti inappropriati o non etici. Mentre OpenAI ha rimosso i filtri durante i test, l’azienda sta esplorando strategie per prevenire l’uso improprio nelle versioni pubbliche. Inoltre, renderà più facile l’identificazione delle immagini generate con il suo strumento. Ciò potrebbe impedire la diffusione di deepfake e potenzialmente identificare l’origine di un’immagine nel caso in cui qualcuno aggiri la censura nativa del modello.

OpenAI è anche consapevole delle preoccupazioni sull’uso legale di opere d’arte umane per l’addestramento del suo modello e ha trovato una risposta a un generatore più etico. DALL-E 3 non riprodurrà i contenuti quando gli verrà chiesto di imitare artisti viventi, e OpenAI consentirà ai creatori di non partecipare. Questo risponde alle reazioni di artisti come Greg Rutkowski, che sostengono che l’IA che copia il loro stile senza consenso non è etica.

Sono state intentate anche importanti cause legali, tra cui quella dell’autore George R.R. Martin che accusa OpenAI di uso improprio di materiale protetto da copyright.

OpenAI non ha risposto immediatamente a una richiesta di commenti da parte di TCN.

Related Posts

Leave a Comment