La startup de generación de voz Resemble AI promete restaurar el audio antiguo

by Thomas enero 20, 2024

written by Thomas enero 20, 2024

Mientras muchas empresas de IA se apresuran a encontrar formas de utilizar la tecnología para mejorar o incluso crear vídeo, Resemble AI se centra en la fidelidad del audio. La startup -que también ofrece un generador de voz por IA para que las empresas creen locuciones realistas de aspecto humano- ha lanzado «Resemble Enhance», una herramienta de código abierto diseñada para mejorar significativamente la calidad del audio histórico.

El nuevo servicio puede tomar una grabación distorsionada y borrosa de un discurso histórico perdido hace mucho tiempo y aplicarle IA para que suene como si se hubiera grabado o emitido ayer.

La empresa canadiense afirma que Resemble Enhance se distingue por su enfoque de doble módulo, que combina un sofisticado denoiser -que elimina los zumbidos y silbidos estáticos de fondo- y un potenciador del habla basado en IA. Esta combinación no sólo elimina el ruido no deseado, sino que enriquece la calidad general del audio.

️Today, presentamos Resemble Enhance: ¡nuestro último modelo potenciado por IA! Enhance es un modelo de mejora del habla de código abierto que transforma el audio ruidoso en habla digna de mención.

Lea el blog técnico: https://t.co/RCp4xi4GqR‍AIVOICE podcasting audioengineer pic. twitter.com/kfdGmKlSgB

– Resemble AI (@resembleai) 14 de diciembre de 2023

Aunque existen otros productos de restauración de audio en el mercado, la combinación de técnicas de Resemble podría ser un diferenciador significativo

¿Cómo funciona?

El denoiser Resemble AI utiliza UNet, un modelo de IA que ayuda a separar los distintos tipos de sonidos que aparecen en una grabación. Es excelente a la hora de filtrar el ruido no deseado de las pistas de audio, dejando sólo el habla como centro de atención.

Una vez que UNet hace su trabajo, entra en acción el módulo potenciador, que amplía el ancho de banda de audio y corrige las distorsiones. Según la empresa, esta doble funcionalidad garantiza que el resultado final no sólo esté libre de ruidos, sino que también posea la riqueza de las grabaciones actuales.

Como herramienta de código abierto, Resemble Enhance es gratuita, una opción atractiva en el mercado tradicionalmente caro de los servicios de restauración multimedia. Los principales beneficiarios de Resemble Enhance son los sectores que dependen de una calidad de audio nítida, como el podcasting, el entretenimiento y la educación. Además, esta herramienta da una nueva vida a las grabaciones históricas, lo que puede proporcionar una visión más clara del pasado.

El lanzamiento de la herramienta se produce cuando la demanda de contenidos digitales de alta calidad está en su punto más alto. Además, la naturaleza de código abierto de Resemble Enhance la convierte en una fuerza potencialmente disruptiva en un mercado dominado actualmente por soluciones propietarias de alto coste.

La convergencia de la IA en la mejora de audio y vídeo allanará probablemente el camino a soluciones de restauración multimedia más completas.

Combinando esta herramienta con otros realzadores de vídeo que utilizan IA generativa u otros modelos para aumentar la escala y mejorar imágenes y rostros -como GPEN o el conocido GFPGan-, los usuarios pueden conseguir resultados profesionales con sus propios ordenadores y con una inversión mínima.

Para experimentar con Resemble Enhance, los usuarios pueden visitar el sitio web oficial de Resemble AI o descargar sus modelos de la página oficial del proyecto en Github.

La startup de generación de voz Resemble AI promete restaurar el audio antiguo

¿Cómo funciona?

Not That Grok: el músico Grimes y OpenAI lanzan un juguete de peluche con IA en su interior

Esta semana en Crypto Twitter: BONK simplemente no se rinde

Related Posts

Leave a Comment Cancel Reply