Home » Разумно решение: Мета пуска аудиобокс, захранван от AI

Разумно решение: Мета пуска аудиобокс, захранван от AI

by Patricia

Компанията майка на Facebook Meta пусна в понеделник първата демонстрация на новата си платформа за аудиогенератори, задвижвана от изкуствен интелект – Audiobox. Гигантът в областта на социалните медии заяви, че Audiobox позволява на потребителите да създават персонализирани гласове и звукови ефекти с помощта на гласови входове и подсказки.

Meta заяви, че Audiobox се основава на технологията, разработена за платформата Voicebox, представена по-рано тази година, но тя превъзхожда Voicebox по качество и включва автоматичен воден знак за „отговорно използване“.

„Audiobox, наследникът на Voicebox, напредва още повече в областта на генеративния изкуствен интелект за аудио, като обединява възможностите за генериране и редактиране на реч, звукови ефекти (кратки, дискретни звуци като кучешки лай, автомобилен клаксон, трясък на гръм и т.н.) и звукови пейзажи, с разнообразни входни механизми за постигане на максимална управляемост за всеки случай на употреба“, заяви екипът на Meta Audiobox.

Екипът обясни, че Audiobox използва „поръчкови решаващи устройства“, което според тях прави процеса на генериране над 25 пъти по-бърз от предишните модели без загуба на производителност.

През юни Meta обяви Voicebox – генеративен инструмент с изкуствен интелект, за който Meta заяви, че може да създава аудио на шест езика, включително английски, френски, немски, испански, полски и португалски, и да го прави по-близо до начина, по който хората говорят естествено в реалния свят.

Тъй като по това време се появиха опасения за дълбоки фалшификати, задвижвани от ИИ, Meta заяви, че няма да пусне Voicebox публично, признавайки потенциала за злоупотреба. За да се бори със злоупотребите с Audiobox, Meta включи воден знак.

„Неотдавнашният напредък в качеството и верността на аудиогенеративния модел даде възможност за нови приложения и [случаи на] използване на модела. В същото време обаче има много хора…, които изразяват загриженост относно рисковете от злоупотреба“, казва екипът на Audiobox в своя доклад. „Ето защо способността да се разпознава кое аудио е генерирано или реално е от решаващо значение, за да се предотврати [злоупотребата] с технологията и да се даде възможност на определени [платформи] да спазват своята политика.“

„Както моделът на Audiobox, така и нашата интерактивна демонстрация разполагат с автоматичен аудио воден знак, така че всяко аудио, създадено с Audiobox, може да бъде точно проследено до неговия произход“, каза Мета. „Нашият метод за създаване на водни знаци вгражда сигнал в аудиото, който е незабележим за човешкото ухо, но може да бъде открит чак до нивото на кадъра с помощта на модел, способен да открива сегменти, генерирани от изкуствен интелект в [аудиото].“

„Проектираме подканяне, базирано на описание и на примери, за да подобрим възможността за контрол и да обединим парадигмите за генериране на реч и звук“, казва екипът. „Позволяваме транскрипция, вокал и други звукови стилове да бъдат контролирани независимо при генерирането на реч.“

Макар че може да е по-бързо, Meta призна, че моделите за генериране на аудио ИИ като Audiobox са ограничени от количеството данни за обучение – в този случай звуци – маркирани и подадени към модела на ИИ, като подчерта важността на правилното маркиране на данните.

Като пример изследователите посочват, че етикетирането на звуци от лай на чихуахуа и лабрадор като специфичен вид куче е за предпочитане пред простото етикетиране като „лай на куче“. Мета казва, че същото се отнася и за моделите на речта като акценти и регионални диалекти.

Говорител на Meta отказва да предостави допълнителни коментари.

Подобно на Google, Microsoft и Amazon, Meta е инвестирала много в изкуствен интелект. По-рано този месец Meta обяви над 20 нови функции, задвижвани от изкуствен интелект, които ще се появят в нейния пакет от платформи, включително Facebook, Instagram и WhatsApp.

Привърженик на отговорното разработване на изкуствен интелект, Meta наскоро си партнира с IBM, за да стартира AI Alliance – консорциум от над 50 компании, университети и мозъчни тръстове, фокусирани върху иновациите и разработването на изкуствен интелект с отворен код.

„AI Alliance обединява изследователи, разработчици и компании за споделяне на инструменти и знания, които могат да помогнат на всички нас да постигнем напредък, независимо дали моделите се споделят открито или не“, заяви президентът по глобалните въпроси на Meta Ник Клег. „Очакваме с нетърпение да работим с партньорите, за да напреднем в развитието на най-съвременните постижения в областта на ИИ и да помогнем на всички да изграждат отговорно.“

Related Posts

Leave a Comment