Стартъпът за генериране на глас Resemble AI обещава да възстанови старото аудио

Докато много компании за изкуствен интелект се надпреварват да търсят начини да използват технологията за подобряване или дори създаване на видео, Resemble AI се фокусира върху верността на звука. Стартъпът, който предлага и AI гласов генератор за бизнеса, за да създава реалистични, подобни на човешки гласове, стартира „Resemble Enhance“ – инструмент с отворен код, предназначен за значително подобряване на качеството на историческото аудио.

Новата услуга може да вземе изкривен, размит запис на отдавна изгубена историческа реч и след това да приложи изкуствен интелект, за да я накара да звучи така, сякаш е записана или излъчена вчера.

Канадската компания твърди, че Resemble Enhance се отличава със своя двумодулен подход, съчетаващ сложен деноусилвател – който премахва статичните фонови шумове и съскания – и подобряващ речта инструмент, задвижван от изкуствен интелект. Тази комбинация не само премахва нежеланите шумове, но и обогатява цялостното качество на звука.

️Today, представяме Resemble Enhance – най-новия ни модел, задвижван от изкуствен интелект! Enhance е модел с отворен код за подобряване на речта, който превръща шумното аудио в забележителна реч!

Прочетете техническия блог: https://t.co/RCp4xi4GqR‍AIVOICE podcasting audioengineer pic. twitter.com/kfdGmKlSgB

– Resemble AI (@resembleai) December 14, 2023

Въпреки че на пазара има и други продукти за възстановяване на звук, комбинацията от техники на Resemble може да се окаже значим отличителен белег.

Как работи?

Деноусилвателят Resemble AI използва UNet – модел на изкуствен интелект, който помага да се разделят различните видове звуци, които се появяват в записа. Той се отличава с това, че филтрира нежелания шум от аудиозаписите, като оставя на фокус само речта.

След като UNet си свърши работата, се включва модулът за подобряване, който разширява честотната лента на звука и коригира изкривяванията. Според компанията тази двойна функционалност гарантира, че крайният резултат е не само без шум, но и притежава богатството на съвременните записи.

Като инструмент с отворен код, Resemble Enhance е достъпен безплатно, което е привлекателна възможност на традиционно скъпия пазар на услуги за възстановяване на медии. Основните бенефициенти на Resemble Enhance са индустриите, които разчитат на чистото качество на звука, като например подкастинг, развлечения и образование. Освен това този инструмент предлага нов живот на историческите записи, като потенциално осигурява по-ясен поглед върху миналото.

Предаването на инструмента идва в момент, когато търсенето на висококачествено цифрово съдържание е на изключително високо ниво. Същевременно характерът на Resemble Enhance като инструмент с отворен код го позиционира като потенциално разрушителна сила на пазара, който понастоящем е доминиран от скъпи патентовани решения.

Сближаването на изкуствения интелект в подобряването на аудио и видео вероятно ще проправи пътя за по-всеобхватни решения за възстановяване на медии.

Чрез комбиниране на този инструмент с други подобрители на видео, които използват генеративен ИИ или други модели за увеличаване и подобряване на изображения и лица – като GPEN или добре познатия GFPGan – потребителите вече могат да постигнат професионални резултати със собствените си компютри срещу минимална инвестиция.

За да експериментират с Resemble Enhance, потребителите могат да посетят официалния уебсайт на Resemble AI или да изтеглят моделите си от официалната страница на проекта в Github.

Стартъпът за генериране на глас Resemble AI обещава да възстанови старото аудио

Как работи?

Не това е Grok: музикантът Grimes и OpenAI пускат на пазара плюшена играчка с изкуствен интелект в нея

Тази седмица в крипто Twitter: BONK просто не иска да се откаже

Related Posts

Leave a Comment Cancel Reply