Спустя десять дней после анонса DALL-E 3, похоже, уже стал доступен широкой публике через инструмент Microsoft Image Creator, входящий в состав браузерного пакета ИИ.
Рано утром в субботу сообщества создателей цифровых произведений искусства на Reddit и Twitter обнаружили, что через Bing доступны значительно улучшенные изображения и возможности интерпретации текста. Обновление, которое, по общему мнению, представляет собой DALL-E 3, до сих пор недоступно через сайт OpenAI.
Итак, создатель изображений Bing теперь использует Dalle 3!
Красиво и бесплатно!
Первые мысли…
Он очень точно следует введенным подсказкам, посмотрите на подсказки в ALT, чтобы убедиться в точности! DALLE3 OpenAI Dalle digitalart AIart AIArtCommuity AIartists pic. twitter.com/GuGX7OrHRH— Orcton (@OrctonAI) September 30, 2023
DALL-E 3 — долгожданное обновление популярного генератора изображений DALL-E 2 AI от компании OpenAI. В то время как ChatGPT, генеративный ИИ-чатбот и текстовый инструмент OpenAI, занимает доминирующее положение в своей области, DALL-E сталкивается с жесткой конкуренцией со стороны таких инструментов, как Midjourney и Stable Diffusion. Сравнение «лоб в лоб» с использованием DALL-E 2 показало, в чем он уступает.
В июле энтузиасты искусственного интеллекта получили возможность поэкспериментировать с готовящейся OpenAI модернизацией DALL-E 2. YouTube-пользователь MattVidPro продемонстрировал, что она превосходит свою предшественницу, а также другие генераторы изображений.
«Это превосходит все, что мы видели раньше, это безумие», — сказал он тогда. «Midjourney не может конкурировать на этом уровне — я даже не думаю, что Midjourney шестой версии сможет конкурировать на этом уровне».
В той предварительной версии технологии отсутствовала защита от вредоносного или обманного использования, предусмотренная основными разработчиками ИИ, что позволило MatVidPro продемонстрировать полностью бесцензурную реализацию DALL-E.
Когда 20 сентября состоялся официальный анонс DALL-E 3, его расширенные возможности стали очевидны, но при этом были установлены защитные ограждения для общественности. На тот момент казалось, что первыми доступ получат платные клиенты продуктов ChatGPT Plus и Enterprise от OpenAI.
Наша новая модель преобразования текста в изображение, DALL-E 3, позволяет переводить тонкие запросы в чрезвычайно подробные и точные изображения.
Скоро в ChatGPT Plus & Enterprise появятся новые модели, которые помогут вам создавать удивительные подсказки для воплощения ваших идей в жизнь:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
— OpenAI (@OpenAI) September 20, 2023
В конце пятницы MattVidPro сообщил о скором выходе DALL-E 3, отметив, что некоторые пользователи могут получить ранний доступ через Bing Image Creator, войдя и выйдя из учетной записи Microsoft, используя более непонятные веб-браузеры или очистив кэш браузера. На данный момент, однако, такие уловки уже не требуются.
«Мы знаем, что DALL-E 3 способен на большее в интерфейсе ChatGPT, но, похоже, никто пока не может получить к нему доступ, но люди определенно получают доступ через Bing Image Creator», — сказал он.
Хотя интерфейс Bing Image Creator не раскрывает информацию об используемой версии DALL-E, MattVidPro поделился тестовыми подсказками, позволяющими определить, используете ли вы новую версию. Среди них — возможность отображения читаемого текста, а не случайной тарабарщины, а также возможность изображать исторических личностей и знаменитостей, хотя некоторые отмечают, что другие инструменты могут намеренно ограничивать свои возможности в этом направлении.
«Эта модель настолько мощная, что ее трудно оценить количественно», — сказал он. «Dall-E 3 — это просто безумие, это лучший генератор изображений с искусственным интеллектом за всю историю».
«Руки опускаются, каждое поколение, которое выходит из этой штуки, лучше, чем все, что я когда-либо видел из других генераторов изображений», — добавил он.