Home » Новият генератор на изображения DALL-E 3 е голямо подобрение – с предпазни огради

Новият генератор на изображения DALL-E 3 е голямо подобрение – с предпазни огради

by Tim

OpenAI, еднорогът, който стои зад бума на индустрията за генеративен изкуствен интелект, представи DALL-E 3, последната итерация на своя генератор на изображения. Със своя контролер ChatGPT ъпгрейдът осигурява изображения с най-високо качество в отговор на подкани на естествен език – и стартира с налични етични контроли.

Генератори на изображения като DALL-E, MidJourney и Stable Diffusion отвориха нови творчески граници за художници и обикновени потребители след бума на изкуствения интелект в края на миналата година. Като превеждат текстови подсказки в зашеметяващи визуални изображения, те предлагат поглед към машинните интерпретации на човешкото творчество. Сега OpenAI се стреми да разшири границите с DALL-E 3 – модел, който може да я върне в пряка конкуренция с други лидери в индустрията.

Представеният рано днес DALL-E 3 демонстрира огромни подобрения в точното изобразяване на подробни текстови описания. За разлика от предишните версии, той се придържа стриктно към сложните подсказки, без да изисква огромни промени в дизайна на подсказките или други сложни трикове за подсказване. Новата система също така е отлична в улавянето на връзките между обектите и генерирането на фотореалистични човешки детайли като ръце и отражения.

Когато се сравнят резултатите от едни и същи подсказки в DALL-E 2 и DALL-E 3, последният създава значително по-остри и по-прецизни изображения. Той може да визуализира изключително реалистични изображения на сцени, като в същото време правилните текстури, осветление и фонове. И изглежда доста способен да генерира текст и да го интегрира в изображенията си – нещо, което остава проблем дори за най-мощните генератори на изображения с изкуствен интелект към днешна дата.

DALL-E 3 е изграден върху ChatGPT, което позволява на потребителите итеративно да усъвършенстват подсказките чрез обмен на разговори. Първите изтекли образци подсказват за изключително бързи възможности за итерация. Както TCN вече съобщи, YouTuber MattVidPro нарече по-ранна бета версия на DALL-E 3 „луда“ и заяви, че дори предстоящата версия на MidJourney не може да се конкурира с нея.

Въпреки това наличността остава строго ограничена до около 400 тестери, а OpenAI твърди, че новият ѝ модел ще бъде пуснат „скоро“.

Изображение, създадено с DALL-E 3, и езикът за подсказване, използван в процеса. Източник: OpenAI

Изображение, създадено с DALL-E 3, и езикът за подсказване, използван в процеса. Източник: OpenAI


Засега потребителите могат да създават изображения с DALL-E 2, като използват приставки с ChatGPT Plus. Тези, които не плащат за абонамент, ще трябва да се справят с ограничения като това:


Пътуването дотук не мина без неравности. По време на фазата на бета тестване моделът беше отбелязан с нецензурния си характер, като можеше да генерира съдържание, вариращо от голота до кървави сцени и насилие. Това повдигна вежди и породи опасения относно потенциалната злоупотреба с подобна технология. Изглежда обаче, че OpenAI е взела тези опасения присърце, като е внедрила в DALL-E 3 функции, които предотвратяват генерирането на съдържание, което би могло да се счита за насилствено, за възрастни или изпълнено с омраза, осигурявайки по-безопасно потребителско изживяване.

Една от тези мерки е събирането на екип от експерти, „които да ни помагат да оценяваме риска и да намаляваме усилията си в области като пропагандата и дезинформацията“.

Притесненията около изкуството на изкуствения интелект продължават, особено по отношение на неподходящо или неетично съдържание. Въпреки че OpenAI премахна филтрите по време на тестовете, компанията проучва стратегии за предотвратяване на злоупотреби в публичните версии. Тя също така ще направи по-лесно идентифицирането на изображения, генерирани с нейния инструмент. Това би могло да предотврати разпространението на deepfake и потенциално да идентифицира произхода на дадено изображение, в случай че някой заобиколи нативната цензура на модела.

OpenAI също така е наясно с опасенията относно законното използване на човешки произведения на изкуството за обучение на своя модел и излезе с отговор на по-етичен генератор. DALL-E 3 няма да възпроизвежда съдържание, когато е помолен да имитира живи художници, а OpenAI ще даде възможност за отказ на създателите. По този начин се адресира ответната реакция на художници като Грег Рутковски, които твърдят, че ИИ копира стила им без съгласие е неетично.

Подадени са и големи съдебни искове, включително от автора Джордж Р. Р. Мартин, който обвинява OpenAI в неправилно използване на материали, защитени с авторски права.

OpenAI не отговори веднага на молбата за коментар от TCN.

Related Posts

Leave a Comment