Dziesięć dni po ogłoszeniu, wydaje się, że DALL-E 3 został już udostępniony publicznie za pośrednictwem narzędzia Image Creator firmy Microsoft jako część pakietu sztucznej inteligencji opartego na przeglądarce.
Wczesnym sobotnim rankiem społeczności twórców sztuki cyfrowej na Reddicie i Twitterze odkryły, że znacznie ulepszone obrazy i możliwości interpretacji tekstu były dostępne za pośrednictwem Bing. Aktualizacja, powszechnie uważana za DALL-E 3, nadal nie jest dostępna za pośrednictwem strony OpenAI.
So Bing image creator is using Dalle 3 now!
Miło i za darmo!
Pierwsze spostrzeżenia…
Bardzo dokładnie podąża za podpowiedziami, sprawdź podpowiedzi w ALT-ach, aby zobaczyć, jak dokładny jest! DALLE3 OpenAI Dalle digitalart AIart AIArtCommuity AIartists pic. twitter.com/GuGX7OrHRH– Orcton (@OrctonAI) 30 września 2023
DALL-E 3 to wyczekiwana aktualizacja niezwykle popularnego generatora obrazów DALL-E 2 AI od OpenAI. Podczas gdy ChatGPT, generatywny chatbot AI i narzędzie tekstowe OpenAI, cieszy się dominującą pozycją w swojej przestrzeni, DALL-E stoi w obliczu ostrej konkurencji ze strony narzędzi takich jak Midjourney i Stable Diffusion. Bezpośrednie porównanie przy użyciu DALL-E 2 ujawniło kilka sposobów, w jakie wypadł on słabo.
W lipcu entuzjaści sztuki AI mogli eksperymentować z trwającymi aktualizacjami OpenAI do DALL-E 2. Wpływowy YouTube MattVidPro zademonstrował, że przewyższa on swojego poprzednika, a także inne generatory obrazów.
„To wysadza z wody wszystko, co widzieliśmy wcześniej, to szaleństwo” – powiedział wtedy. „Midjourney nie może konkurować na tym poziomie – nie sądzę nawet, by Midjourney w wersji szóstej był w stanie konkurować na tym poziomie”.
W podglądzie tej technologii brakowało zabezpieczeń wprowadzonych przez głównych twórców sztucznej inteligencji, aby zapobiec złośliwym lub oszukańczym zastosowaniom, co pozwoliło MatVidPro zademonstrować w pełni nieocenzurowaną implementację DALL-E.
Kiedy DALL-E 3 został oficjalnie ogłoszony 20 września, jego ulepszone możliwości były jasne – z zabezpieczeniami wprowadzonymi w międzyczasie dla opinii publicznej. W tamtym czasie wydawało się, że płatni klienci produktów ChatGPT Plus i Enterprise firmy OpenAI otrzymają dostęp jako pierwsi.
Nasz nowy model zamiany tekstu na obraz, DALL-E 3, może tłumaczyć zniuansowane żądania na niezwykle szczegółowe i dokładne obrazy.
Wkrótce w ChatGPT Plus & Enterprise, który może pomóc w tworzeniu niesamowitych podpowiedzi, aby ożywić Twoje pomysły: https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
– OpenAI (@OpenAI) 20 września 2023
Pod koniec piątku MattVidPro ujawnił, że publiczne wydanie DALL-E 3 jest bliskie, zauważając, że niektórzy użytkownicy mogą uzyskać wczesny dostęp za pośrednictwem Bing Image Creator, logując się i wylogowując ze swoich kont Microsoft, używając bardziej niejasnych przeglądarek internetowych lub czyszcząc pamięć podręczną przeglądarki. W chwili pisania tego tekstu takie sztuczki nie są już jednak wymagane.
„Wiemy, że DALL-E 3 jest zdolny do więcej w ChatGPT [interfejsie], ale nikt tak naprawdę nie wydaje się jeszcze uzyskiwać do tego dostępu, ale ludzie zdecydowanie uzyskują dostęp za pośrednictwem Bing Image Creator” – powiedział.
Chociaż interfejs Bing Image Creator nie ujawnia używanej wersji DALL-E, MattVidPro udostępnił monity testowe, które ujawniłyby, czy korzystasz z nowej wersji. Wśród nich jest możliwość renderowania czytelnego tekstu zamiast losowego bełkotu, a także możliwość przedstawiania postaci historycznych i znanych celebrytów – choć niektórzy zauważyli, że inne narzędzia mogą celowo ograniczać swoje możliwości na tym froncie.
„Ten model jest tak potężny, że trudno go określić ilościowo” – powiedział. „Dall-E 3 jest absolutnie szalony – to z pewnością najlepszy generator obrazów AI w historii”.
„Bez dwóch zdań, każda pojedyncza generacja, która wychodzi z tej rzeczy, jest lepsza niż cokolwiek, co kiedykolwiek widziałem z jakiegokolwiek innego generatora obrazu” – dodał.