Home » Rozumné rozhodnutí: Společnost Meta uvádí na trh audiobox poháněný umělou inteligencí

Rozumné rozhodnutí: Společnost Meta uvádí na trh audiobox poháněný umělou inteligencí

by Patricia

Mateřská společnost Facebooku Meta v pondělí zveřejnila první ukázku své nové platformy Audiobox, která je poháněna umělou inteligencí. Gigant v oblasti sociálních médií uvedl, že Audiobox umožňuje uživatelům vytvářet vlastní hlasy a zvukové efekty pomocí hlasových vstupů a pokynů.

Společnost Meta uvedla, že Audiobox vychází z technologie vyvinuté pro její platformu Voicebox, která byla představena na začátku tohoto roku, ale kvalitou Voicebox překonává a zahrnuje automatický vodoznak pro „zodpovědné používání“.

„Audiobox, nástupce Voiceboxu, posouvá generativní umělou inteligenci pro audio ještě dále tím, že sjednocuje možnosti generování a editace řeči, zvukových efektů (krátkých, diskrétních zvuků, jako je štěkot psa, klakson auta, praskot hromu atd.) a zvukových krajin s různými vstupními mechanismy pro maximalizaci ovladatelnosti pro každý případ použití,“ uvedl tým Audiobox společnosti Meta.

Tým vysvětlil, že Audiobox používá „řešiče na míru“, díky čemuž je podle nich proces generování více než 25krát rychlejší než u předchozích modelů, aniž by došlo ke ztrátě výkonu.

V červnu společnost Meta oznámila Voicebox, generativní nástroj umělé inteligence, který podle společnosti Meta dokáže vytvářet zvuk v šesti jazycích, včetně angličtiny, francouzštiny, němčiny, španělštiny, polštiny a portugalštiny, a dokáže se tak přiblížit tomu, jak lidé přirozeně mluví v reálném světě.

Vzhledem k tomu, že v té době vzrostly obavy z hlubokých falzifikátů poháněných umělou inteligencí, společnost Meta uvedla, že Voicebox neuvolní pro veřejnost, protože si uvědomuje možnost jeho zneužití. V rámci boje proti zneužití u Audioboxu společnost Meta zahrnula vodoznak.

„Nedávný pokrok v kvalitě a věrnosti generativního modelu audia umožnil nové aplikace a [případy] použití modelu. Zároveň však existuje mnoho lidí…, kteří vyjadřují obavy z rizika zneužití,“ uvedl tým Audioboxu ve své zprávě. „Proto je schopnost rozpoznat, který zvuk je generovaný a který skutečný, zásadní pro to, aby se zabránilo [zneužití] technologie a aby určité [platformy] mohly dodržovat své zásady.“

„Jak model Audiobox, tak naše interaktivní ukázka jsou vybaveny automatickým vodoznakem zvuku, takže u jakéhokoli zvuku vytvořeného pomocí Audioboxu lze přesně vysledovat jeho původ,“ uvedla Meta. „Naše metoda vodoznaku vkládá do zvuku signál, který je pro lidské ucho nepostřehnutelný, ale lze jej detekovat až na úrovni snímku pomocí modelu schopného najít v [audiu] segmenty vytvořené umělou inteligencí.“

„Navrhujeme výzvy založené na popisu a příkladech, abychom zvýšili ovladatelnost a sjednotili paradigmata generování řeči a zvuku,“ uvedl tým. „Při generování řeči umožňujeme nezávislé ovládání přepisu, vokálu a dalších zvukových stylů.“

I když to může být rychlejší, Meta připustila, že modely AI generující zvuk, jako je Audiobox, jsou omezeny množstvím trénovacích dat – v tomto případě zvuků – označených a vložených do modelu AI, což zdůrazňuje důležitost správného označení dat.

Jako příklad výzkumníci uvedli, že označení zvuků štěkající čivavy a labradora jako konkrétního typu psa je vhodnější než prosté označení jako „štěkot psa“. Meta říká, že totéž platí pro řečové vzory, jako jsou přízvuky a regionální dialekty.

Mluvčí společnosti Meta odmítl poskytnout další komentář.

Stejně jako společnosti Google, Microsoft a Amazon i Meta investovala značné prostředky do umělé inteligence. Začátkem tohoto měsíce Meta oznámila, že do jejího balíku platforem, včetně Facebooku, Instagramu a WhatsAppu, přibude více než 20 nových funkcí využívajících umělou inteligenci.

Společnost Meta, která je zastáncem odpovědného vývoje umělé inteligence, nedávno ve spolupráci s IBM založila AI Alliance, konsorcium více než 50 společností, univerzit a think-tanků zaměřených na inovace a vývoj umělé inteligence s otevřeným zdrojovým kódem.

„AI Alliance sdružuje výzkumníky, vývojáře a společnosti, aby sdíleli nástroje a znalosti, které nám všem mohou pomoci dosáhnout pokroku, ať už jsou modely sdíleny otevřeně, nebo ne,“ uvedl prezident pro globální záležitosti společnosti Meta Nick Clegg. „Těšíme se na spolupráci s partnery, abychom posunuli stav techniky v oblasti umělé inteligence a pomohli všem odpovědně budovat.“

Related Posts

Leave a Comment