Nieuwe AI afbeeldingsgenerator doet meer dan SDXL met minder

by v maart 23, 2024

written by v maart 23, 2024

Stability AI, het bedrijf achter de razend populaire Stable Diffusion-beeldgenerator, heeft zojuist een nieuwe granaat gegooid in de fel concurrerende AI-arena.

Stability’s gloednieuwe Stable Cascade, aangedreven door de nieuwe, open-source Würstchen-architectuur, biedt een zeer efficiënte en modulaire aanpak voor het genereren van tekst-naar-beeld, waarbij kwaliteit, snelheid en aanpasbaarheid in balans zijn.

Volgens het bedrijf bereikt het model een compressiefactor die zijn gelijke niet kent in traditionele Stable Diffusion-modellen en kan het resultaten produceren met een hogere resolutie en meer details, vergelijkbaar met moderne generatoren zoals SDXL of MidJourney (die meestal werken met resoluties van 1024 x 1024).

Afbeelding: Stability AI

Würstchen ingrediënten

Stable Cascade gebruikt een proces in drie fasen, in tegenstelling tot de traditionele Stable Diffusion-pijplijn:

Fase C: De tekst-voorwaardelijke latent-generator Fase C richt zich alleen op het verwerken van op tekst gebaseerde instructies en het produceren van gecomprimeerde latents. Deze ontkoppelde tekstgeneratiebenadering vermindert de complexiteit en de kosten van fijnafstelling voor specifieke gebruiksgevallen drastisch.

Afbeelding: Stability AI

Met andere woorden, het doet wat zijn naam doet vermoeden. Het begint met een tekstgestuurde generator die kleine snapshots van afbeeldingen genereert, die worden opgeblazen tot een meer gedetailleerde afbeelding en vervolgens op de juiste manier aan je ogen worden gepresenteerd als een afbeelding van hoge kwaliteit met volledige resolutie.

Modulaire voordelen

Het modulaire ontwerp van Stable Cascade biedt volgens de ontwikkelaars een aantal overtuigende voordelen. Ten eerste is er de extreme efficiëntie: dankzij de gecomprimeerde latente ruimte (de manier waarop een AI beeldcompositie evalueert in tegenstelling tot de pixelruimte, die mensen zien) en het gerichte Stage C-model, bereikt Stable Cascade snellere inferentietijden, wat betekent dat het zijn voorspellingen sneller berekent. En het doet dit met aanzienlijk lagere hardwarevereisten in vergelijking met grotere Stable Diffusion-modellen zoals SDXL.

Interne tests van Stability AI toonden aan dat Stable Cascade consistent beter presteert dan vergelijkbare modellen zoals SDXL, zowel op het gebied van beeldkwaliteit als esthetiek. Bovendien behaalt het model deze resultaten met zeer hoge snelheden, terwijl het aanzienlijk minder rekenkracht vergt.

Afbeelding: Stability AI

Een ander voordeel dat Stability AI claimt is de veelzijdigheid. Veel van de gereedschappen die kunstenaars van Stable Diffusion nu gebruiken om hun werk te verfijnen, zoals ControlNets of LoRas, zijn compatibel. En vanwege de extreme efficiëntie kunnen gebruikers meer van deze gereedschappen toevoegen aan hun workflows zonder dat hun geheugen instort.

De lichtgewicht architectuur van het model, de kleinere voetafdruk van het model en de compatibiliteit met minder krachtige computerhardware verlagen de instapdrempel, waardoor geavanceerde tekst-naar-beeld generatietechnieken toegankelijker worden voor gewone gebruikers en onderzoekers.

Meer doen met minder

src=

Nieuwe AI afbeeldingsgenerator doet meer dan SDXL met minder

Würstchen ingrediënten

Modulaire voordelen

Meer doen met minder

Puntenseizoen: Wie wint de NFT marktplaatsoorlogen op Ethereum, Solana en Bitcoin?

BlackRock Bitcoin ETF wint $500M als Wall Street eetlust voor BTC groeit

Related Posts

Leave a Comment Cancel Reply