発表から10日後、DALL-E 3はブラウザベースのAIスイートの一部として、マイクロソフトのImage Creatorツールですでに一般公開されているようだ。
土曜日の早朝、RedditとTwitterのデジタルアートクリエイターコミュニティは、大幅に改善された画像とテキスト解釈機能がBingを通じて利用可能であることを発見した。このアップグレードはDALL-E 3であると広く信じられているが、OpenAIのウェブサイトからはまだ入手できない。
Bingの画像クリエーターはDalle 3を使っているんですね!
無料でいいですね!
最初の感想は…
プロンプトの入力に非常に忠実に従います! DALLE3 OpenAI Dalle digitalart AIart AIArtCommuity AIartists pic. twitter.com/GuGX7OrHRH– Orcton (@OrctonAI) 2023年9月30日
DALL-E 3は、OpenAIから絶大な人気を誇るAI画像ジェネレーターDALL-E 2の待望のアップグレード版です。OpenAIの生成AIチャットボットとテキストベースのツールであるChatGPTは、その分野で支配的な地位を享受していますが、DALL-EはMidjourneyやStable Diffusionのようなツールとの厳しい競争に直面しています。DALL-E 2を使った真っ向からの比較では、いくつかの点で劣っていることが明らかになった。
YouTubeのインフルエンサーであるMattVidProは、DALL-E 2が他の画像ジェネレーターと同様に前作を凌駕することを実証した。
“これは、我々が以前に見たものを吹き飛ばすもので、正気の沙汰ではありません。「Midjourneyはこのレベルでは太刀打ちできない。Midjourneyのバージョン6もこのレベルでは太刀打ちできないだろう。
その技術プレビューには、悪意ある使用や欺瞞的な使用を防ぐために主要なAI開発者が導入している保護が欠けていたため、MatVidProは完全に検閲されていないDALL-Eの実装を実証することができた。
9月20日にDALL-E 3が正式に発表されたとき、その改善された機能は明確であった。その時点では、OpenAIのChatGPT PlusとEnterprise製品の有料顧客が最初にアクセスできるようだった。
Our new text-to-image model, DALL-E 3, can translate nuanced requests into extremely detailed and accurate images.
ChatGPT Plus & Enterpriseでは、あなたのアイデアを実現するための素晴らしいプロンプトを作成することができます:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
– OpenAI (@OpenAI) 2023年9月20日
金曜日の終わりに、MattVidProはDALL-E 3の一般公開が間近に迫っていることを明らかにし、一部のユーザーはマイクロソフトアカウントからログインしたりログアウトしたり、よりわかりにくいウェブブラウザを使用したり、ブラウザのキャッシュをクリアしたりすることで、Bing Image Creator経由で早期アクセスが可能であることを指摘した。
“我々はDALL-E 3がChatGPT [インターフェイス]でより多くのことが可能であることを知っているが、誰も実際にはまだそれにアクセスすることはできないようだが、人々は間違いなくBing Image Creatorを介してアクセスしている “と彼は言った。
Bing Image Creatorのインターフェイスは、使用されているDALL-Eのバージョンを開示していませんが、MattVidProは、新しいバージョンを使用しているかどうかを明らかにするテストプロンプトを共有しました。その中には、ランダムなちんぷんかんぷんな言葉ではなく、読みやすいテキストをレンダリングする機能や、歴史上の人物や有名人を描写する機能などがある。
「このモデルは非常に強力で、数値化するのは難しい。「Dall-E 3は全く正気の沙汰とは思えない。
「ハッキリ言って、こいつから出てくるすべての世代は、私がこれまで他のどの画像ジェネレーターから見たものよりも優れている。