MidJourney вече беше един от най-впечатляващите генератори на AI изображения, а с пускането на версия 5.1 той стана много по-мощен. Актуализацията на алгоритъма означава, че дори за начинаещите сега е невероятно лесно да създават зашеметяващи произведения на изкуството с минимални усилия – и дълбоки фалшификати. Много и много дълбоки фалшификати.
Генераторът на изображения с изкуствен интелект влезе в общественото съзнание миналия месец, след като се разпространиха дълбоко фалшиви изображения на папа Франциск в бяло пухено палто. Спорът предизвика разговори за етиката на генераторите на изкуствен интелект като MidJourney и скоро след това компанията предприе действия.
Използването на думата „папа“ в MidJourney вече е забранено, но създаването на дълбоки фалшификати на други хора, като президента Джо Байдън, все още е разрешено – вероятно докато не видим вирусно изображение на Байдън, облечен в розов неонов спандекс гащеризон, който прави йога в Овалния кабинет.
Или може би такъв, на който Байдън е облечен в междугалактически спартански костюм, който прилича малко на Железния човек.
MidJourney също така позволява на потребителите да създават висококачествени дийпфейкове, като използват снимки като референция. Тази функция значително увеличи популярността на MidJourney поради впечатляващите резултати, които предоставя, и ниската крива на обучение. В момента той е най-популярният модел за изображения с изкуствен интелект по отношение на интереса на потребителите, като изпреварва Dall-e и Stable Diffusion.
Най-новото обновяване на MidJourney обещава подобрения в начина, по който алгоритъмът интерпретира подсказките на потребителите. Версия 5.0 беше пусната само преди три месеца и отбеляза значително отклонение от версия 4.
V5.1 вече е налична! Изображенията са по-съгласувани, резки и красиви. Тя е по-лесна за използване и би трябвало да реагира по-точно на инструкциите. Добавихме и режим „RAW“ за експертни потребители, за да намалим „мнението“ на нашия модел и да ви дадем повече творчески контрол.
– Midjourney (@midjourney) 3 май 2023
Този нов модел предлага по-висока кохерентност, по-голяма точност на текстовите подсказки, по-малко нежелани граници или текстови артефакти (странните случайни неща, които понякога се появяват на изображенията) и по-остри резултати като цяло, според MidJourney. Черешката на тортата е, че новата версия е била обучена да бъде по-„на мнение“.
Това означава, че моделът има свободата да бъде по-креативен, когато интерпретира подкана от потребителя. Това води до по-добри изображения с основни подсказки – дори с абсурдни команди от само една или две думи.
Например простото сравняване на резултатите за подканите „Bitcoin Wallet“ с помощта на версии 5.1 и 5.0 демонстрира разликите и подобренията. Версия 5.1 си представя кожен портфейл с бродирано лого на биткойн, поставен на маса. Версия 5 просто показва портфейл с биткойн върху обикновена повърхност.
Новата версия допълнително подчертава силните страни, които доведоха до експлозията на MidJourney, без да забравя опитните потребители, които вече разполагат с режим RAW, ако искат по-точни и по-малко „мнение“ резултати.
А какво да кажем за многопръстите ръце? MidJourney v5.1 е значително подобрен. Представянето на ръцете вече е успешно в повечето случаи, въпреки че генераторът все още произвежда някои грешки.
Екипът на MidJourney твърди, че в бъдеще може да видим версия 5.2, която допълнително ще подобри възможностите на този инструмент. Ако третият път е чаровен, тогава дните, в които генераторите на изкуствен интелект объркваха ръцете в любимите ни дълбоки фалшификати, може би най-накрая ще останат зад гърба ни.