Deset dní po svém oznámení byl DALL-E 3 zřejmě již zpřístupněn veřejnosti prostřednictvím nástroje Image Creator společnosti Microsoft jako součást balíčku AI pro prohlížeče.
V sobotu brzy ráno komunity tvůrců digitálního umění na Redditu a Twitteru zjistily, že prostřednictvím služby Bing jsou k dispozici výrazně vylepšené možnosti interpretace obrázků a textu. Vylepšení, o němž se všeobecně předpokládá, že jde o DALL-E 3, zatím není k dispozici prostřednictvím webových stránek OpenAI.
Takže tvůrce obrázků Bing nyní používá Dalle 3!
Pěkné a zdarma!
První myšlenky…
Velmi přesně sleduje zadání výzvy , podívejte se na výzvy v ALTu, abyste viděli, jak je přesný! DALLE3 OpenAI Dalle digitalart AIart AIArtCommuity AIartists pic. twitter.com/GuGX7OrHRH– Orcton (@OrctonAI) 30. září 2023
DALL-E 3 je očekávaný upgrade nesmírně populárního generátoru obrázků umělé inteligence DALL-E 2 od společnosti OpenAI. Zatímco ChatGPT, generativní AI chatbot a textový nástroj společnosti OpenAI, má ve svém oboru dominantní postavení, DALL-E čelí silné konkurenci nástrojů, jako jsou Midjourney a Stable Diffusion. Srovnání s pomocí DALL-E 2 odhalilo některé způsoby, kterými zaostává.
V červenci mohli nadšenci do umělecké inteligence experimentovat s právě probíhajícími vylepšeními nástroje OpenAI DALL-E 2. Influencer YouTube MattVidPro demonstroval, že překonává svého předchůdce i jiné generátory obrázků.
„Tohle vyrazí dech všemu, co jsme dosud viděli, je to šílené,“ řekl tehdy. „Midjourney nemůže konkurovat na této úrovni – dokonce si ani nemyslím, že by Midjourney verze šest byla schopna konkurovat na této úrovni.“
V tomto technologickém náhledu chyběly ochrany, které zavedli hlavní vývojáři umělé inteligence, aby zabránili škodlivému nebo klamavému použití, což umožnilo společnosti MatVidPro předvést plně necenzurovanou implementaci DALL-E.
Když byl 20. září DALL-E 3 oficiálně oznámen, byly jeho vylepšené schopnosti jasné – mezitím byla zavedena ochranná opatření pro veřejnost. V té době se zdálo, že placení zákazníci produktů ChatGPT Plus a Enterprise společnosti OpenAI získají přístup jako první.
Náš nový model převodu textu na obraz, DALL-E 3, dokáže převádět nuancované požadavky na extrémně detailní a přesné obrazy.
Již brzy se objeví v aplikaci ChatGPT Plus & Enterprise, která vám pomůže vytvořit úžasné podněty k realizaci vašich nápadů:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
– OpenAI (@OpenAI) 20. září 2023
Koncem pátku MattVidPro odhalil, že se blíží veřejné vydání DALL-E 3, a poznamenal, že někteří uživatelé mohou získat předčasný přístup prostřednictvím služby Bing Image Creator přihlášením a odhlášením ze svého účtu Microsoft, použitím obskurnějších webových prohlížečů nebo vymazáním mezipaměti prohlížeče. Od okamžiku napsání tohoto článku však tyto triky již nejsou nutné.
„Víme, že DALL-E 3 toho umí v [rozhraní] ChatGPT více, ale zatím se zdá, že k němu nikdo nezíská přístup, ale lidé k němu určitě získají přístup přes Bing Image Creator,“ řekl.
Přestože rozhraní Bing Image Creator neprozrazuje používanou verzi DALL-E, MattVidPro sdílel testovací výzvy, které by odhalily, zda používáte novou verzi. Patří mezi ně schopnost vykreslovat čitelný text namísto náhodných blábolů a možnost zobrazovat historické postavy a slavné osobnosti – i když někteří poznamenali, že jiné nástroje mohou své možnosti v této oblasti záměrně omezovat.
„Tento model je tak silný, že je těžké ho kvantifikovat,“ řekl. „Dall-E 3 je naprosto šílený – je to bezpochyby nejlepší generátor obrázků s umělou inteligencí vůbec.“
„Ruku na srdce, každá generace, která z této věci vyjde, je lepší než cokoli, co jsem kdy viděl z jakéhokoli jiného generátoru obrázků,“ dodal.