尽管许多人工智能公司都在努力寻找使用该技术增强甚至创建视频的方法,但 Resemble AI 公司却专注于音频保真度。这家初创公司还为企业提供人工智能语音生成器,用于创建逼真的人类配音,并推出了一款开源工具 “Resemble Enhance”,旨在显著提升历史音频的质量。
这项新服务可以处理失真、模糊的失传已久的历史语音录音,然后应用人工智能使其听起来就像昨天录制或播出的一样。
这家加拿大公司称,Resemble Enhance 的独特之处在于它采用了双模块方法,将复杂的去噪器(可消除静态背景嗡嗡声和嘶嘶声)和人工智能语音增强器结合在一起。这种组合不仅能消除不必要的噪音,还能提高音频的整体质量。
️今天,我们向您介绍 Resemble Enhance–我们最新的人工智能驱动模型!Enhance 是一个开源语音增强模型,可将嘈杂的音频转化为值得注意的语音!
阅读技术博客: https://t.co/RCp4xi4GqRAIVOICEpodcastingaudioengineerpic. twitter.com/kfdGmKlSgB
– Resemble AI (@resembleai) 2023年12月14日
。
即使市场上有其他音频修复产品,Resemble 的技术组合也可以成为一个有意义的差异化优势。
Resemble人工智能去噪器使用 UNet,这是一种人工智能模型,有助于分离录音中出现的不同类型的声音。它擅长过滤音轨中不需要的噪音,只保留语音作为重点。
UNet 完成工作后,增强器模块就会启动,扩展音频带宽并纠正失真。该公司表示,这种双重功能可确保最终输出不仅无噪音,而且具有当代录音的丰富性。
作为一款开源工具,Resemble Enhance 可以免费使用,这在传统的昂贵媒体修复服务市场上是一个引人注目的选择。Resemble Enhance 的主要受益者是播客、娱乐和教育等依赖清晰音频质量的行业。此外,该工具还能让历史录音重获新生,有可能让人们更清晰地了解过去。
该工具的发布正值对高质量数字内容的需求达到历史最高水平之时。同时,Resemble Enhance 的开源性质使其在目前由高成本专有解决方案主导的市场中具有潜在的颠覆性力量。
人工智能在音频和视频增强领域的融合可能会为更全面的媒体修复解决方案铺平道路。
通过将该工具与其他使用生成式人工智能或其他模型来放大和增强图像和人脸的视频增强器(如 GPEN 或著名的 GFPGan)相结合,用户现在只需少量投资,就能用自己的电脑获得专业效果。
要试用 Resemble Enhance,用户可以访问 Resemble AI 官方网站,或从该项目的官方 Github 页面下载模型。