Home » Emu Video a Emu Edit: Meta představuje modely umělé inteligence pro video a obrázky

Emu Video a Emu Edit: Meta představuje modely umělé inteligence pro video a obrázky

by Patricia

Meta ve čtvrtek předvedla ukázku svých dvou nejnovějších nástrojů umělé inteligence, Emu Video a Emu Edit, a poskytla tak první skutečný pohled na technologii oznámenou na konferenci Meta Connect v září. Emu Video je nástroj, který umožňuje uživatelům vytvářet videa z čistě textových podnětů, zatímco Emu Edit představuje odlišný přístup k úpravě obrázků známý jako inpainting.

Zavedení aplikací Emu Video a Emu Edit je pro společnost Meta strategickým krokem, který je podle jejích slov stále v souladu s její širší vizí Metaverse. Společnost uvedla, že tyto nástroje nabízejí nové tvůrčí možnosti, které mají oslovit širokou škálu uživatelů, od profesionálních tvůrců obsahu až po ty, kteří jednoduše hledají nové způsoby vyjádření myšlenek.

Zejména Emu Video demonstruje odhodlání společnosti pokročit v tvorbě obsahu řízeného umělou inteligencí – a mohlo by se stát významným konkurentem populárních jmen, jako jsou Runway a Pika Labs, která dosud v této oblasti dominovala.

Emu Video: tvorba videa z textu

Emu Video používá dvoufázový proces vytváření videí z textových podnětů. Nejprve vygeneruje obrázek na základě zadaného textu a poté vytvoří video odvozené z textu i vygenerovaného obrázku. Tento přístup zjednodušuje proces generování videa a vyhýbá se složitějším, vícemodelovým metodám, které byly použity v předchozím nástroji Meta Make-A-Video.

Videa vytvořená nástrojem Emu Video jsou omezena na rozlišení 512×512 pixelů, ale vykazují pozoruhodnou soudržnost s poskytnutými textovými podněty. Přesný převod textu na vizuální vyprávění odlišuje Emu Video od většiny stávajících modelů a komerčních řešení.


Přestože samotné modely nejsou veřejně dostupné, uživatelé mohou experimentovat se sadou předem určených podnětů a výsledky jsou poměrně hladké, s minimálními rozdíly mezi snímky.

Emu Edit: úprava snímků pomocí inpaintingu

Společně s Emu Video představila společnost Meta také možnosti nástroje Emu Edit, který je řízen umělou inteligencí a je určen k provádění různých úloh úprav obrázků na základě interpretace instrukcí přirozeného jazyka umělou inteligencí. Emu Edit umožňuje uživatelům upravovat obrázky s vysokou úrovní přesnosti a flexibility.

„Emu Edit [je] víceúkolový model pro úpravu obrázků, který stanovuje nejmodernější výsledky v oblasti úpravy obrázků na základě instrukcí,“ uvádí se ve výzkumné zprávě společnosti Meta k tomuto nástroji a zdůrazňuje se jeho schopnost přesně provádět složité editační instrukce.


Přesnost aplikace Emu Edit je zvýšena použitím difuzorů, což je pokročilá technologie umělé inteligence zpopularizovaná technologií Stable Diffusion. Tento přístup zajišťuje, že úpravy zachovávají vizuální integritu původních snímků.

Zaměření společnosti Meta na vývoj nástrojů umělé inteligence, jako jsou Emu Video a Emu Edit, ztělesňuje její strategii vytvářet technologie klíčové pro vytváření Metaverza. Patří sem i vývoj Meta AI, osobního asistenta využívajícího velký jazykový model LLaMA-2, a zavedení multimodality v zařízeních rozšířené reality.

Related Posts

Leave a Comment