Новият генератор на изображения DALL-E 3 е голямо подобрение - с предпазни огради

OpenAI, еднорогът, който стои зад бума на индустрията за генеративен изкуствен интелект, представи DALL-E 3, последната итерация на своя генератор на изображения. Със своя контролер ChatGPT ъпгрейдът осигурява изображения с най-високо качество в отговор на подкани на естествен език – и стартира с налични етични контроли.

Генератори на изображения като DALL-E, MidJourney и Stable Diffusion отвориха нови творчески граници за художници и обикновени потребители след бума на изкуствения интелект в края на миналата година. Като превеждат текстови подсказки в зашеметяващи визуални изображения, те предлагат поглед към машинните интерпретации на човешкото творчество. Сега OpenAI се стреми да разшири границите с DALL-E 3 – модел, който може да я върне в пряка конкуренция с други лидери в индустрията.

Представеният рано днес DALL-E 3 демонстрира огромни подобрения в точното изобразяване на подробни текстови описания. За разлика от предишните версии, той се придържа стриктно към сложните подсказки, без да изисква огромни промени в дизайна на подсказките или други сложни трикове за подсказване. Новата система също така е отлична в улавянето на връзките между обектите и генерирането на фотореалистични човешки детайли като ръце и отражения.

Нашият нов модел за преобразуване на текст в изображение, DALL-E 3, може да преобразува нюансираните заявки в изключително подробни и точни изображения.

Очаквайте скоро ChatGPT Plus & Enterprise, който може да ви помогне да създадете невероятни подсказки, за да вдъхнете живот на идеите си:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL

– OpenAI (@OpenAI) September 20, 2023

Когато се сравнят резултатите от едни и същи подсказки в DALL-E 2 и DALL-E 3, последният създава значително по-остри и по-прецизни изображения. Той може да визуализира изключително реалистични изображения на сцени, като в същото време правилните текстури, осветление и фонове. И изглежда доста способен да генерира текст и да го интегрира в изображенията си – нещо, което остава проблем дори за най-мощните генератори на изображения с изкуствен интелект към днешна дата.

DALL-E 3 е изграден върху ChatGPT, което позволява на потребителите итеративно да усъвършенстват подсказките чрез обмен на разговори. Първите изтекли образци подсказват за изключително бързи възможности за итерация. Както TCN вече съобщи, YouTuber MattVidPro нарече по-ранна бета версия на DALL-E 3 „луда“ и заяви, че дори предстоящата версия на MidJourney не може да се конкурира с нея.

Въпреки това наличността остава строго ограничена до около 400 тестери, а OpenAI твърди, че новият ѝ модел ще бъде пуснат „скоро“.

Изображение, създадено с DALL-E 3, и езикът за подсказване, използван в процеса. Източник: OpenAI

Засега потребителите могат да създават изображения с DALL-E 2, като използват приставки с ChatGPT Plus. Тези, които не плащат за абонамент, ще трябва да се справят с ограничения като това:

Пътуването дотук не мина без неравности. По време на фазата на бета тестване моделът беше отбелязан с нецензурния си характер, като можеше да генерира съдържание, вариращо от голота до кървави сцени и насилие. Това повдигна вежди и породи опасения относно потенциалната злоупотреба с подобна технология. Изглежда обаче, че OpenAI е взела тези опасения присърце, като е внедрила в DALL-E 3 функции, които предотвратяват генерирането на съдържание, което би могло да се счита за насилствено, за възрастни или изпълнено с омраза, осигурявайки по-безопасно потребителско изживяване.

Една от тези мерки е събирането на екип от експерти, „които да ни помагат да оценяваме риска и да намаляваме усилията си в области като пропагандата и дезинформацията“.

Притесненията около изкуството на изкуствения интелект продължават, особено по отношение на неподходящо или неетично съдържание. Въпреки че OpenAI премахна филтрите по време на тестовете, компанията проучва стратегии за предотвратяване на злоупотреби в публичните версии. Тя също така ще направи по-лесно идентифицирането на изображения, генерирани с нейния инструмент. Това би могло да предотврати разпространението на deepfake и потенциално да идентифицира произхода на дадено изображение, в случай че някой заобиколи нативната цензура на модела.

OpenAI също така е наясно с опасенията относно законното използване на човешки произведения на изкуството за обучение на своя модел и излезе с отговор на по-етичен генератор. DALL-E 3 няма да възпроизвежда съдържание, когато е помолен да имитира живи художници, а OpenAI ще даде възможност за отказ на създателите. По този начин се адресира ответната реакция на художници като Грег Рутковски, които твърдят, че ИИ копира стила им без съгласие е неетично.

Подадени са и големи съдебни искове, включително от автора Джордж Р. Р. Мартин, който обвинява OpenAI в неправилно използване на материали, защитени с авторски права.

OpenAI не отговори веднага на молбата за коментар от TCN.

Новият генератор на изображения DALL-E 3 е голямо подобрение – с предпазни огради

Подкрепено от Andreessen Fintech Eco App „удвоява“ криптовалутите, които не са под опека

След неуспешен опит да възстанови едноименната компания, Бен „Bitboy“ Армстронг иска от феновете пари в брой

Related Posts

Leave a Comment Cancel Reply