Nový generátor obrázků DALL-E 3 je velkým vylepšením - s ochrannými zábranami

OpenAI, jednorožec, který stojí za rozmachem odvětví generativní umělé inteligence, představil DALL-E 3, nejnovější iteraci svého generátoru obrázků. Díky svému ovladači ChatGPT poskytuje upgrade obrázky špičkové kvality v reakci na výzvy v přirozeném jazyce – a spouští se s etickými kontrolami na místě.

Generátory obrázků jako DALL-E, MidJourney a Stable Diffusion otevřely od rozmachu umělé inteligence koncem loňského roku nové tvůrčí hranice pro umělce i běžné uživatele. Tím, že převádějí textové podněty do ohromujících vizuálních podob, nabízejí náhledy na strojové interpretace lidské kreativity. Nyní se společnost OpenAI snaží posunout hranice ještě dál s modelem DALL-E 3, který by ji mohl opět postavit do přímé konkurence s ostatními lídry v oboru.

DALL-E 3, který byl představen dnes brzy ráno, demonstruje obrovské zlepšení v přesném zobrazování podrobných textových popisů. Na rozdíl od předchozích verzí se přesně drží složitých pobídek, aniž by vyžadoval obrovské úpravy pobídkového inženýrství nebo jiné složité pobídkové triky. Nový systém také vyniká v zachycování vztahů mezi objekty a generování fotorealistických lidských detailů, jako jsou ruce a odrazy.

Náš nový model převodu textu na obraz, DALL-E 3, dokáže převést nuance požadavků do extrémně detailních a přesných obrazů.

Již brzy se objeví v aplikaci ChatGPT Plus & Enterprise, která vám pomůže vytvářet úžasné podněty k realizaci vašich nápadů:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL

– OpenAI (@OpenAI) 20. září 2023

Při porovnání výstupů ze stejných podnětů v programech DALL-E 2 a DALL-E 3 vytváří druhý jmenovaný program výrazně ostřejší a přesnější snímky. Dokáže vykreslit extrémně realistické zobrazení scén a zároveň správně nastavit textury, osvětlení a pozadí. A zdá se, že je docela schopný generovat text a integrovat ho do svých obrázků – což je něco, co zůstává problémem i pro dosud nejvýkonnější generátory obrázků s umělou inteligencí.

DALL-E 3 je postaven na ChatGPT, který umožňuje uživatelům iterativně zpřesňovat podněty prostřednictvím konverzačních výměn. První uniklé ukázky naznačují neuvěřitelně rychlé možnosti iterace. Jak TCN již dříve informoval, YouTuber MattVidPro označil dřívější beta verzi DALL-E 3 za „šílenou“ a tvrdil, že jí nemůže konkurovat ani připravovaná verze od MidJourney.

Dostupnost však zůstává přísně omezena na přibližně 400 testerů a OpenAI tvrdí, že její nový model bude vydán „brzy“.

Obrázek vytvořený pomocí programu DALL-E 3 a při něm použitého jazyka podnětů. Zdroj: Dall-Express, s. r. o: OpenAI

Prozatím mohou uživatelé vytvářet obrázky pomocí DALL-E 2 pomocí zásuvných modulů s ChatGPT Plus. Ti, kteří si předplatné nezaplatí, se budou muset vypořádat s omezeními, jako je toto:

Cesta k tomuto bodu se neobešla bez hrbolů. Během fáze beta testování byl model poznamenán svou necenzurovanou povahou, která byla schopna generovat obsah od nahoty až po gore a násilí. To vyvolalo pozdvižení a obavy z možného zneužití takové technologie. Zdá se však, že společnost OpenAI si tyto obavy vzala k srdci a do modelu DALL-E 3 implementovala funkce, které zabraňují generování obsahu, který by mohl být považován za násilný, pro dospělé nebo nenávistný, a zajišťují tak bezpečnější uživatelský zážitek.

Jedním z takových opatření je sestavení týmu odborníků, „kteří nám pomohou informovat o vyhodnocování rizik a zmírňování jejich dopadů v oblastech, jako je propaganda a dezinformace“.

Obavy kolem umělecké inteligence přetrvávají, zejména pokud jde o nevhodný nebo neetický obsah. Zatímco OpenAI během testování odstranila filtry, společnost zkoumá strategie, jak zabránit zneužití ve veřejných verzích. Usnadní také identifikaci obrázků vytvořených pomocí svého nástroje. To by mohlo zabránit šíření deepfake a potenciálně identifikovat původ obrázku v případě, že někdo obejde nativní cenzuru modelu.

Společnost OpenAI si je také vědoma obav ohledně legálního používání lidských uměleckých děl pro trénování svého modelu a přišla s odpovědí na etičtější generátor. DALL-E 3 nebude reprodukovat obsah, pokud bude požádán o napodobení žijících umělců, a OpenAI umožní tvůrcům odhlášení. Řeší se tím odpor umělců, jako je Greg Rutkowski, kteří tvrdí, že kopírování jejich stylu umělou inteligencí bez souhlasu je neetické.

Byly také podány velké žaloby, včetně žaloby od autora George R. R. Martina, který obvinil OpenAI z nesprávného používání materiálu chráněného autorskými právy.

Společnost OpenAI na žádost TCN o komentář bezprostředně nereagovala.

Nový generátor obrázků DALL-E 3 je velkým vylepšením – s ochrannými zábranami

Fintech Eco App s podporou Andreessena „zdvojnásobuje“ na neúřední kryptoměny

Po neúspěšném pokusu o obnovení stejnojmenné společnosti žádá Ben ‚Bitboy‘ Armstrong fanoušky o hotovost

Related Posts

Leave a Comment Cancel Reply