Ideogram, generátor obrázků umělé inteligence vytvořený bývalými inženýry společnosti Google, vydal první sadu aktualizací, jejichž cílem je zvýšit funkčnost a použitelnost platformy. Upgrady přidávají schopnosti, které se lépe vyrovnají nabídkám společností Stable Diffusion a Midjourney za zajímavou cenu.
První veřejné vydání Ideogramu v únoru si rychle získalo oblibu mezi nadšenci do umělé inteligence jako silná a schopná alternativa k Midjourney, Dall-E 3 a Stable Diffusion. Testy TCN zjistily, že ve srovnání s ostatními populárními generátory obrázků vyniká v porozumění pobídkám, schopnostech generování textu, prostorovém povědomí, dodržování pobídek, rozmanitosti stylů, generování osob a značek a celkové kvalitě.
„Jsme nadšeni, že můžeme vydat významnou aktualizaci Ideogramu 1.0, našeho nejpokročilejšího modelu pro převod textu na obrázek, spolu s několika novými funkcemi, včetně ‚popisu‘ pro popis obrázku, negativní výzvy a kontroly kvality a rychlosti vykreslování obrázku,“ uvádí se v oficiálním oznámení.
„Describe“ analyzuje obrázek a pomáhá s popisky; „negative prompt“ říká modelu, kterým prvkům se má vyhnout při generování, a ovládání vykreslování obrázků a rychlosti vyvažuje kvalitu výstupu s efektivitou pro ty, kteří dávají přednost rychlému generování před detailním. Posledně jmenovaná funkce napodobuje modely Turbo a LCM společnosti Stable Difussion.
Tato vylepšení však mají háček: jsou k dispozici pouze platícím zákazníkům. Bezplatní uživatelé budou mít k modelu přístup, ale budou omezeni na generování maximálně 25 dávek po 4 snímcích.
Zájemci, kteří chtějí tyto funkce vyzkoušet, mohou přejít na plán „Basic“ za 7 dolarů měsíčně nebo na variantu „Plus“ za 16 dolarů. Placené plány také poskytují uživatelům přístup k dalším výhodám, jako je soukromé generování, kontrola osiva, možnost inpaintingu a neomezené generování v pomalém režimu.
Funkce „describe“ je významným doplňkem zejména pro základní uživatele. Tento pomocník poskytuje podrobný popis jakéhokoli nahraného obrázku, který lze následně použít k vygenerování přesnějších nebo popisnějších výzev, aby v dalších iteracích lépe odpovídaly referenci. Uživatelé si mohou vyžádat popis libovolného obrázku v kanálu Ideogram nebo vlastních obrázků nahraných z místního zařízení.
Ideogram nyní také umožňuje uživatelům přepínat mezi třemi možnostmi vykreslování: rychlým, výchozím a kvalitním. Rychlý režim upřednostňuje rychlost a generuje obrázky přibližně za pět sekund, zatímco režim kvality upřednostňuje jemnější detaily a generuje obrázky přibližně za 20 sekund.
Funkce negativní výzvy mezitím rozšiřuje možnosti úprav programu Ideogram. Tento nástroj umožňuje uživatelům zadat, co nechtějí ve vygenerovaných obrázcích vidět, a poskytuje tak větší kontrolu nad výstupem. Je to obzvláště užitečná funkce pro zpřesnění výsledků generování textu na obrázek, což umožňuje přesnější a relevantnější obrázky na první pokus.
V neposlední řadě Ideogram uvádí, že vylepšil vykreslování textu a fotorealismus. Tým tvrdí, že vylepšení snižuje chybovost textu o dalších 15 % ve srovnání s původním modelem. Ideogram tvrdí, že recenzenti dávali přednost obrázkům generovaným vylepšeným modelem o 30-50 % více než v původní, původní verzi.
Tým Ideogramu poprvé oznámil vylepšení minulý měsíc během relace na Discordu, která mezi komunitou uživatelů vzbudila brzký pozitivní ohlas.
Díky těmto vylepšením a placeným měsíčním úrovním od 7 do 16 dolarů je Ideogram silným a cenově výhodným uchazečem o nástroj pro generování obrázků s umělou inteligencí. Pro srovnání, předplatné MidJourney stojí 96 až 1152 dolarů ročně, předplatné ChatGPT Plus – které poskytuje přístup k Dall-E 3- stojí 20 dolarů měsíčně a další generátory obrázků AI, jako je Leonardo AI a Maze Guru, mají úrovně předplatného mezi 10 a 25 dolary.
Pro ty, kteří nechtějí platit za prémiové funkce, je mezitím open-source Stable Diffusion zdarma a nabízí podobné funkce, alespoň pro uživatele s výkonnějšími počítači.