Zatímco mnoho společností zabývajících se umělou inteligencí se předhání v hledání způsobů, jak tuto technologii využít k vylepšení nebo dokonce vytvoření videa, Resemble AI se zaměřuje na věrnost zvuku. Startup – který nabízí také generátor hlasu AI, který mohou firmy používat k vytváření realistických hlasových projevů podobných lidským – spustil „Resemble Enhance“, open-source nástroj určený k výraznému zvýšení kvality historického zvuku.
Nová služba dokáže vzít zkreslenou, rozmazanou nahrávku dávno ztraceného historického projevu a následně použít umělou inteligenci, aby zněl, jako by byl nahrán nebo odvysílán včera.
Kanadská společnost uvádí, že Resemble Enhance se vyznačuje dvoumodulovým přístupem, který kombinuje sofistikovaný denoiser – který odstraňuje statické šumy a sykavky v pozadí – a vylepšovač řeči s využitím umělé inteligence. Tato kombinace nejen odstraňuje nežádoucí šum, ale také obohacuje celkovou kvalitu zvuku.
️Today, představujeme Resemble Enhance – náš nejnovější model poháněný umělou inteligencí! Enhance je open-source model pro vylepšení řeči, který transformuje hlučný zvuk na pozoruhodnou řeč!
Přečtěte si technický blog: https://t.co/RCp4xi4GqRAIVOICE podcasting audioengineer pic. twitter.com/kfdGmKlSgB
– Resemble AI (@resembleai) December 14, 2023
Přestože jsou na trhu i jiné produkty pro obnovu zvuku, kombinace technik společnosti Resemble by mohla být významným odlišovacím prvkem.
Jak to funguje?
Denoiser Resemble AI využívá UNet, model umělé inteligence, který pomáhá oddělit různé typy zvuků, které se objevují na nahrávce. Vyniká v odfiltrování nežádoucího šumu ze zvukových stop a ponechává v centru pozornosti pouze řeč.
Jakmile UNet odvede svou práci, nastupuje modul enhancer, který rozšiřuje šířku zvukového pásma a opravuje zkreslení. Tato dvojí funkce podle společnosti zajišťuje, že výsledný výstup je nejen bez šumu, ale má také bohatost současných nahrávek.
Jako nástroj s otevřeným zdrojovým kódem je Resemble Enhance dostupný zdarma, což je na tradičně drahém trhu služeb pro obnovu médií zajímavá volba. Hlavními uživateli nástroje Resemble Enhance jsou odvětví závislá na čisté kvalitě zvuku, například podcasting, zábava a vzdělávání. Kromě toho tento nástroj nabízí nový život historickým nahrávkám a potenciálně poskytuje jasnější pohled do minulosti.
Vydání nástroje přichází v době, kdy je poptávka po vysoce kvalitním digitálním obsahu na historickém maximu. Přitom open-source povaha Resemble Enhance jej staví do pozice potenciálně disruptivní síly na trhu, kterému v současnosti dominují nákladná proprietární řešení.
Konvergence umělé inteligence v oblasti vylepšování zvuku a videa pravděpodobně připraví půdu pro komplexnější řešení obnovy médií.
Kombinací tohoto nástroje s dalšími nástroji pro vylepšování videa, které využívají generativní umělou inteligenci nebo jiné modely pro zvětšování a vylepšování obrázků a obličejů – jako je GPEN nebo známý GFPGan – mohou nyní uživatelé dosáhnout profesionálních výsledků s vlastním počítačem za minimální investice.
Pro experimentování s Resemble Enhance mohou uživatelé navštívit oficiální webové stránky Resemble AI nebo si stáhnout modely z oficiální stránky projektu na Githubu.