Ideogram, генератор на изображения с изкуствен интелект, създаден от бивши инженери на Google, пусна първия си набор от актуализации, предназначени да направят платформата по-функционална и използваема. Обновленията добавят възможности, за да се сравнят по-добре с предложенията на Stable Diffusion и Midjourney на убедителна цена.
Първата публична версия на Ideogram през февруари бързо придоби популярност сред ентусиастите на изкуствения интелект като силна и способна алтернатива на Midjourney, Dall-E 3 и Stable Diffusion. Тестовете на TCN установиха, че той се отличава с разбиране на подкани, възможности за генериране на текст, пространствена осведоменост, придържане към подкани, разнообразие от стилове, генериране на хора и марки и цялостно качество в сравнение с други популярни генератори на изображения.
„Развълнувани сме да пуснем значително подобрение на Ideogram 1.0, нашия най-усъвършенстван модел за преобразуване на текст в изображение, заедно с няколко нови функции, включително „опиши“ за надписване на изображения, отрицателна подкана и контрол на качеството и скоростта на изображението“, се казва в официалното съобщение.
„Опиши“ анализира изображението и помага при създаването на надписи; „негативната подсказка“ казва на модела кои елементи да избягва да генерира, а контролът на рендирането и скоростта на изображението балансира качеството на продукцията с ефективността за тези, които предпочитат бързите генерации пред детайлните. Последната функция имитира моделите Turbo и LCM на Stable Difussion.
Тези подобрения обаче имат уловка: те са достъпни само за плащащи клиенти. Безплатните потребители ще имат достъп до модела, но ще бъдат ограничени до генерирането на до 25 партиди от по 4 изображения.
Желаещите да изпробват тези функции могат да преминат към плана „Basic“ за 7 долара на месец или към опцията „Plus“ за 16 долара. Платените планове дават на потребителите достъп и до други екстри, като частни генерации, контрол на семената, възможности за рисуване и неограничени генерации в бавен режим.
Функцията „описание“ е важно допълнение, особено за базовите потребители. Този асистент дава подробни описания на всяко качено изображение, които след това могат да се използват за генериране на по-точни или по-описателни подсказки, за да съответстват по-добре на референцията при следващите итерации. Потребителите могат да поискат описания за всяко изображение в канала Ideogram или за свои собствени изображения, качени от локално устройство.
Ideogram вече позволява на потребителите да превключват между три опции за визуализация: бърза, по подразбиране и качествена. Бързият режим дава приоритет на скоростта и генерира изображения за около пет секунди, а качественият режим дава приоритет на по-фините детайли и генерира изображения за около 20 секунди.
В същото време функцията за отрицателни подкани разширява възможностите за редактиране на Ideogram. Този инструмент позволява на потребителите да посочват какво не искат да виждат в генерираните изображения, осигурявайки по-голям контрол върху изхода. Това е особено полезна функция за усъвършенстване на резултатите от генерирането на текст в изображение, което позволява по-точни и подходящи изображения още при първото заснемане.
И накрая, Ideogram твърди, че е подобрила рендирането на текст и фотореализма. Екипът твърди, че ъпгрейдът намалява процента на грешките в текста с допълнителни 15% в сравнение с оригиналния си модел. Ideogram твърди, че рецензентите предпочитат изображенията, генерирани от обновения модел, с 30-50 % повече от първоначалната версия.
Екипът на Ideogram обяви за първи път подобренията миналия месец по време на сесия в Discord, която създаде първоначален положителен отзвук сред общността на потребителите.
С тези подобрения и платените месечни нива от 7 до 16 долара Ideogram е силен и рентабилен претендент за инструмент за генериране на изображения с изкуствен интелект. За сравнение, абонаментът за MidJourney струва между 96 и 1152 долара на година, абонаментът за ChatGPT Plus – който дава достъп до Dall-E 3- струва 20 долара на месец, а други генератори на изображения с изкуствен интелект като Leonardo AI и Maze Guru имат абонаментни нива между 10 и 25 долара.
Междувременно за тези, които не желаят да плащат за премиум функции, Stable Diffusion с отворен код е безплатен и предлага подобни функционалности, поне за потребители с по-мощни компютри.