ジェネレーティブAI業界のブームを支えるユニコーン、
OpenAIは、画像ジェネレーターの最新版であるDALL-E 3を発表した。ChatGPTコントローラーを搭載し、自然言語のプロンプトに反応する最高品質の画像を提供する。
DALL-E、MidJourney、Stable Diffusionのようなイメージジェネレーターは、昨年末のAIブーム以来、アーティストやカジュアルユーザーに新たな創造的フロンティアを開いてきた。テキストプロンプトを見事なビジュアルに変換することで、人間の創造性を機械が解釈する一端を垣間見ることができる。そして今、オープンAIはDALL-E 3でさらに限界を押し広げようとしている。
本日未明に発表されたDALL-E 3は、詳細なテキスト説明を正確に描写する上で大幅な改善を示している。以前のバージョンとは異なり、複雑なプロンプトに忠実で、プロンプト・エンジニアリングの大幅な調整やその他の複雑なプロンプトのトリックを必要としない。新システムはまた、オブジェクト間の関係をキャプチャし、手や反射のような写実的な人間の細部を生成することに優れています。
私たちの新しいテキスト画像変換モデル、DALL-E 3は、ニュアンス豊かなリクエストを非常に詳細で正確な画像に変換することができます。
ChatGPT Plus & Enterpriseでは、あなたのアイデアを実現するための素晴らしいプロンプトを作成することができます。https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
– OpenAI (@OpenAI) September 20, 2023
DALL-E2とDALL-E3の同じプロンプトからの出力を比較すると、後者の方が明らかにシャープで正確な画像を生成します。テクスチャ、ライティング、背景を正しく取得しながら、非常にリアルなシーンの描写が可能だ。さらに、テキストを生成して画像に統合する能力もかなり高いようだ。
DALL-E 3はChatGPTの上に構築されており、ユーザーは会話のやり取りを通じてプロンプトを繰り返し改良することができる。初期にリークされたサンプルは、非常に高速な反復機能を示唆している。TCNが以前報じたように、YouTuberのMattVidProはDALL-E 3の初期ベータ版を「正気の沙汰ではない」と呼び、MidJourneyの次期バージョンでさえ太刀打ちできないと断言した。
しかし、利用可能なテスターはまだ400人程度に限定されており、OpenAIは新モデルを「まもなく」リリースするとしている。

DALL-E 3で作成された画像と、その過程で使用されたプロンプト言語。ソースはこちら: OpenAI
今のところ、ユーザーはChatGPT Plusのプラグインを使ってDALL-E 2で画像を作成することができます。サブスクリプションにお金を払わない人は、このような制限に対処しなければなりません:
ここまでの道のりに、紆余曲折がなかったわけではない。ベータテストの段階で、このモデルはヌードからグロや暴力まで、さまざまなコンテンツを生成できる無修正の性質が注目された。これは眉をひそめさせ、このような技術が悪用されるのではないかという懸念をかき立てた。しかし、OpenAIはこうした懸念を真摯に受け止め、DALL-E 3には暴力的、成人向け、または憎悪的と見なされるコンテンツの生成を防止する機能を実装し、より安全なユーザー体験を保証しているようだ。
そのような措置のひとつが、”プロパガンダや誤報のような分野でのリスク評価と緩和の取り組みを知らせるための “専門家チームの結成である。
AIアートをめぐる懸念は、特に不適切または非倫理的なコンテンツに関して根強い。OpenAIはテスト中にフィルターを外したが、同社は公開バージョンでの悪用を防ぐ戦略を模索している。また、同社のツールで生成された画像の識別を容易にする予定だ。これにより、ディープフェイクの拡散を防ぎ、誰かがモデル固有の検閲を回避した場合に画像の出所を特定できる可能性がある。
OpenAIはまた、モデルのトレーニングに人間のアートワークを合法的に使用することへの懸念も認識しており、より倫理的なジェネレーターへの答えを導き出した。DALL-E 3は、存命のアーティストを模倣するよう求められた場合、コンテンツを複製することはなく、OpenAIはクリエイターのオプトアウトを可能にする。これはグレッグ・ラトコウスキーのようなアーティストからの反発に対応するもので、彼らはAIが同意なしに彼らのスタイルをコピーすることは倫理に反すると主張している。
また、作家のジョージ・R・R・マーティンがOpenAIの著作物の不適切な使用を非難するなど、大規模な訴訟も起こされている。
OpenAIは、TCNがコメントを求めたのに対し、すぐには回答しなかった。