Home » Emu Video и Emu Edit: Meta дебютира с AI модели за видео и изображения

Emu Video и Emu Edit: Meta дебютира с AI модели за видео и изображения

by v

В четвъртък Meta показа промъкване на двата си най-нови инструмента за изкуствен интелект – Emu Video и Emu Edit, като предостави първия реален поглед към технологията, обявена на Meta Connect през септември. Emu Video е инструмент, който позволява на потребителите да създават видеоклипове от чисти текстови подсказки, а Emu Edit въвежда различен подход към редактирането на изображения, известен като inpainting.

Въвеждането на Emu Video и Emu Edit е стратегически ход за Meta, който според нея все още съответства на по-широката ѝ визия за Metaverse. Компанията заяви, че тези инструменти предлагат нови творчески възможности, предназначени да привлекат широк кръг потребители – от професионални създатели на съдържание до такива, които просто търсят нови начини за изразяване на идеи.

По-специално Emu Video демонстрира ангажимента на компанията да развива генерирането на съдържание, управлявано от изкуствен интелект – и може да се превърне в основен конкурент на популярни имена като Runway и Pika Labs, които досега доминираха в това пространство.

Emu Video: създаване на текст във видео

Emu Video използва двуетапен процес за създаване на видеоклипове от текстови подсказки. Първоначално генерира изображение въз основа на въведения текст, след което създава видео, получено от текста и генерираното изображение. Този подход опростява процеса на генериране на видеоклипове, като избягва по-сложните, многомоделни методи, използвани в предишния инструмент Make-A-Video на Meta.

Видеоклиповете, създадени от Emu Video, са ограничени до разделителна способност 512×512 пиксела, но показват забележителна съгласуваност с предоставените текстови подсказки. Точното преобразуване на текста във визуални разкази отличава Emu Video от повечето съществуващи модели и търговски решения.


Въпреки че самите модели не са публично достъпни, потребителите могат да експериментират с набор от предварително зададени подсказки, а резултатите са доста плавни, с минимални разминавания между кадрите.

Emu Edit: редактиране на изображения с инпайнтинг

Заедно с Emu Video Meta представи и възможностите на Emu Edit – инструмент, управляван от изкуствен интелект, предназначен за изпълнение на различни задачи за редактиране на изображения въз основа на интерпретация на инструкции на естествен език от изкуствен интелект. Emu Edit позволява на потребителите да редактират изображения с висока степен на прецизност и гъвкавост.

„Emu Edit [е] многозадачен модел за редактиране на изображения, който определя най-съвременните резултати в редактирането на изображения на базата на инструкции“, се казва в изследователския документ на Meta за инструмента, като се подчертава способността му да изпълнява точно сложни инструкции за редактиране.


Прецизността на „Ему Редактиране“ се повишава чрез използване на дифузори – усъвършенствана технология на изкуствения интелект, популяризирана от „Стабилна дифузия“. Този подход гарантира, че редакциите запазват визуалната цялост на оригиналните изображения.

Фокусът на Meta върху разработването на инструменти за изкуствен интелект като Emu Video и Emu Edit въплъщава стратегията ѝ за създаване на технологии, които са от решаващо значение за създаването на Metaverse. Това включва разработката на Meta AI, личен асистент, задвижван от големия езиков модел LLaMA-2, и въвеждането на мултимодалност в устройствата за AR.

Related Posts

Leave a Comment