Ideogram, генератор изображений с искусственным интеллектом, созданный бывшими инженерами Google, выпустил свой первый набор обновлений, призванных сделать платформу более функциональной и удобной. Обновления добавляют возможности, чтобы лучше соответствовать предложениям Stable Diffusion и Midjourney по привлекательной цене.
Первый публичный релиз Ideogram в феврале быстро завоевал популярность среди энтузиастов ИИ как сильная и способная альтернатива Midjourney, Dall-E 3 и Stable Diffusion. Тесты, проведенные TCN, показали, что Ideogram превосходит другие популярные генераторы изображений по таким параметрам, как понимание текста, способность генерировать текст, пространственная осведомленность, соблюдение сроков, разнообразие стилей, генерирование людей и брендов, а также общее качество.
«Мы рады выпустить крупное обновление Ideogram 1.0, нашей самой продвинутой модели преобразования текста в изображение, а также несколько новых функций, включая «описать» для создания подписей к изображениям, негативные подсказки, контроль качества и скорости рендеринга изображений», — говорится в официальном сообщении.
Функция «Описать» анализирует изображение и помогает создавать подписи; «Негативная подсказка» сообщает модели, какие элементы следует избегать генерировать, а контроль качества и скорости рендеринга изображений позволяет сбалансировать качество вывода и эффективность для тех, кто предпочитает быстрые генерации, а не детальные. Последняя функция имитирует модели Turbo и LCM от Stable Difussion.
Однако в этих обновлениях есть одна загвоздка: они доступны только платным пользователям. Бесплатные пользователи получат доступ к модели, но будут ограничены созданием не более 25 партий по 4 изображения в каждой.
Те, кто хочет попробовать эти возможности, могут перейти на тарифный план «Базовый» за 7 долларов в месяц или на тарифный план «Плюс» за 16 долларов. Платные тарифные планы также дают пользователям доступ к другим преимуществам, таким как приватные генерации, контроль семян, возможность инпайтинга и неограниченные генерации в медленном режиме.
Функция «описать» — важное дополнение, особенно для базовых пользователей. Этот помощник дает подробное описание любого загруженного изображения, которое затем может быть использовано для создания более точных или более описательных подсказок для лучшего соответствия эталону в последующих итерациях. Пользователи могут запросить описание для любого изображения в ленте Ideogram или для своих собственных изображений, загруженных с локального устройства.
Ideogram теперь также позволяет пользователям переключаться между тремя вариантами рендеринга: быстрым, стандартным и качественным. В быстром режиме приоритет отдается скорости, и изображения создаются примерно за пять секунд, а в качественном режиме приоритет отдается более тонким деталям, и изображения создаются примерно за 20 секунд.
Функция негативных подсказок расширяет возможности редактирования Ideogram. Этот инструмент позволяет пользователям указывать, что они не хотят видеть в создаваемых изображениях, обеспечивая больший контроль над результатом. Эта функция особенно полезна для уточнения результатов генерации текста в изображение, позволяя получать более точные и релевантные изображения с первого раза.
Наконец, Ideogram заявляет, что улучшила рендеринг и фотореалистичность текста. По словам команды, обновление позволило снизить количество ошибок в тексте еще на 15 % по сравнению с оригинальной моделью. Ideogram утверждает, что рецензенты предпочитают изображения, созданные обновленной моделью, на 30-50 % больше, чем оригинальной, первоначальной версией.
Команда Ideogram впервые объявила об улучшениях в прошлом месяце во время сессии Discord, которая вызвала положительный резонанс среди пользователей.
Благодаря этим улучшениям и ежемесячным платным уровням от $7 до $16 Ideogram является сильным и экономически эффективным претендентом на роль инструмента искусственного интеллекта для создания изображений. Для сравнения: подписка на MidJourney стоит от 96 до 1152 долларов в год, подписка на ChatGPT Plus, которая дает доступ к Dall-E 3-, стоит 20 долларов в месяц, а другие генераторы изображений ИИ, такие как Leonardo AI и Maze Guru, имеют подписку от 10 до 25 долларов.
Для тех, кто не готов платить за премиум-функции, предлагается бесплатная программа Stable Diffusion с открытым исходным кодом, предлагающая аналогичные функции, по крайней мере, для пользователей с более мощными компьютерами.