OpenAI, de eenhoorn achter de hausse van de Generative AI-industrie, heeft DALL-E 3 onthuld, de nieuwste versie van zijn beeldgenerator. Met zijn ChatGPT-controller levert de upgrade beelden van topkwaliteit in reactie op natuurlijke taalaanwijzingen – en hij start met ethische controles op zijn plaats.
Beeldgeneratoren zoals DALL-E, MidJourney en Stable Diffusion hebben sinds de AI-hausse eind vorig jaar nieuwe creatieve grenzen geopend voor kunstenaars en gewone gebruikers. Door tekstaanwijzingen te vertalen in verbluffende visuals, bieden ze een glimp van machine-interpretaties van menselijke creativiteit. Nu wil OpenAI de grenzen nog verder verleggen met DALL-E 3, een model waarmee het weer rechtstreeks de concurrentie aan kan gaan met andere marktleiders.
DALL-E 3 is vandaag onthuld en laat enorme verbeteringen zien in het nauwkeurig weergeven van gedetailleerde tekstuele beschrijvingen. In tegenstelling tot eerdere versies houdt het systeem zich nauwgezet aan complexe prompts zonder dat er enorme aanpassingen aan de prompt-engineering of andere ingewikkelde prompting-trucs nodig zijn. Het nieuwe systeem blinkt ook uit in het vastleggen van relaties tussen objecten en het genereren van fotorealistische menselijke details zoals handen en reflecties.
Ons nieuwe tekst-naar-beeld-model, DALL-E 3, kan genuanceerde verzoeken omzetten in extreem gedetailleerde en nauwkeurige afbeeldingen.
Binnenkort beschikbaar in ChatGPT Plus & Enterprise, waarmee je geweldige prompts kunt maken om je ideeën tot leven te brengen:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
– OpenAI (@OpenAI) September 20, 2023
Wanneer de output van dezelfde prompts in DALL-E 2 en DALL-E 3 worden vergeleken, produceert de laatste duidelijk scherpere en preciezere beelden. Het kan extreem realistische afbeeldingen van scènes renderen en tegelijkertijd texturen, belichting en achtergronden goed weergeven. En het lijkt behoorlijk goed in staat om tekst te genereren en te integreren in de afbeeldingen, iets wat zelfs voor de krachtigste AI-afbeeldingengenerators tot nu toe een probleem blijft.
DALL-E 3 is gebouwd bovenop ChatGPT, waarmee gebruikers iteratief prompts kunnen verfijnen door middel van conversatie-uitwisselingen. De eerste uitgelekte voorbeelden wijzen op razendsnelle iteratiemogelijkheden. Zoals TCN eerder meldde, noemde YouTuber MattVidPro een eerdere bèta van DALL-E 3 “waanzinnig” en beweerde hij dat zelfs MidJourney’s aankomende versie niet kon concurreren.
De beschikbaarheid blijft echter beperkt tot ongeveer 400 testers en OpenAI zegt dat het nieuwe model “binnenkort” zal worden uitgebracht.
Een afbeelding die is gemaakt met DALL-E 3 en de prompttaal die daarbij is gebruikt. Bron: OpenAI
Voorlopig kunnen gebruikers afbeeldingen maken met DALL-E 2 via plugins met ChatGPT Plus. Wie niet betaalt voor een abonnement, krijgt te maken met beperkingen zoals deze:
De reis naar dit punt is niet zonder hobbels geweest. Tijdens de bètatestfase stond het model bekend om zijn ongecensureerde aard en kon het inhoud genereren die varieerde van naakt tot gore en geweld. Dit deed wenkbrauwen fronsen en leidde tot bezorgdheid over mogelijk misbruik van dergelijke technologie. Maar OpenAI lijkt deze zorgen ter harte te hebben genomen en heeft in DALL-E 3 functies geïmplementeerd die voorkomen dat er inhoud wordt gegenereerd die als gewelddadig, volwassen of haatdragend kan worden beschouwd.Een van deze maatregelen is de samenstelling van een team van experts “om te helpen bij onze risicobeoordeling en inspanningen op het gebied van propaganda en desinformatie”.
Zorgen over AI-kunst blijven bestaan, vooral met betrekking tot ongepaste of onethische inhoud. Hoewel OpenAI tijdens het testen filters heeft verwijderd, onderzoekt het bedrijf strategieën om misbruik in openbare versies te voorkomen. Het zal het ook makkelijker maken om afbeeldingen te identificeren die met zijn tool zijn gegenereerd. Dit kan de verspreiding van deepfakes voorkomen en mogelijk de herkomst van een afbeelding identificeren voor het geval iemand de censuur van het model omzeilt.
OpenAI is zich ook bewust van de bezorgdheid over het legale gebruik van menselijke kunstwerken voor het trainen van zijn model en kwam met een antwoord op een meer ethische generator. DALL-E 3 zal geen inhoud reproduceren wanneer het wordt gevraagd om levende artiesten na te bootsen, en OpenAI zal opt-outs voor makers mogelijk maken. Dit is een reactie op het verzet van artiesten zoals Greg Rutkowski, die beweren dat AI die hun stijl kopieert zonder toestemming onethisch is.
Er zijn ook grote rechtszaken aangespannen, onder andere door auteur George R.R. Martin die OpenAI beschuldigt van onjuist gebruik van auteursrechtelijk beschermd materiaal.
OpenAI reageerde niet direct op een verzoek om commentaar van TCN.