A Resemble AI, uma empresa que gera voz, promete restaurar o áudio antigo

by v Janeiro 20, 2024

written by v Janeiro 20, 2024

Enquanto muitas empresas de IA correm para encontrar formas de utilizar a tecnologia para melhorar ou mesmo criar vídeo, a Resemble AI está concentrada na fidelidade do áudio. A startup – que também oferece um gerador de voz de IA para as empresas utilizarem para criar locuções realistas semelhantes às humanas – lançou o ‘Resemble Enhance’, uma ferramenta de código aberto concebida para melhorar significativamente a qualidade do áudio histórico.

O novo serviço pode pegar numa gravação distorcida e difusa de um discurso histórico há muito perdido e, em seguida, aplicar a IA para o fazer soar como se tivesse sido gravado ou transmitido ontem.

A empresa canadiana afirma que o Resemble Enhance se distingue pela sua abordagem de módulo duplo, combinando um sofisticado denoiser – que remove zumbidos e assobios estáticos de fundo – e um melhorador de discurso alimentado por IA. Esta combinação não só elimina o ruído indesejado, como também enriquece a qualidade geral do áudio.

️Today, apresentamos o Resemble Enhance – o nosso mais recente modelo alimentado por IA! O Enhance é um modelo de aprimoramento de fala de código aberto que transforma áudio ruidoso em fala digna de nota!

Leia o blogue técnico: https://t.co/RCp4xi4GqR‍AIVOICE podcasting audioengineer pic. twitter.com/kfdGmKlSgB

– Resemble AI (@resembleai) December 14, 2023

Embora existam outros produtos de restauração de áudio no mercado, a combinação de técnicas do Resemble pode ser um diferencial significativo.

Como funciona?

O denoiser Resemble AI utiliza o UNet, um modelo de IA que ajuda a separar os diferentes tipos de sons que aparecem numa gravação. É excelente a filtrar o ruído indesejado das faixas de áudio, deixando apenas o discurso como foco.

Quando a UNet faz o seu trabalho, o módulo de melhoramento entra em ação, aumentando a largura de banda do áudio e corrigindo as distorções. Esta dupla funcionalidade, segundo a empresa, garante que o resultado final não é apenas isento de ruído, mas também possui a riqueza das gravações contemporâneas.

Sendo uma ferramenta de código aberto, o Resemble Enhance é gratuito, o que constitui uma opção interessante no mercado tradicionalmente dispendioso dos serviços de restauro de multimédia. Os principais beneficiários do Resemble Enhance são os sectores que dependem de uma qualidade de áudio nítida, como o podcasting, o entretenimento e a educação. Além disso, esta ferramenta oferece um novo sopro de vida a gravações históricas, proporcionando potencialmente uma visão mais clara do passado.
O lançamento da ferramenta surge numa altura em que a procura de conteúdos digitais de alta qualidade está em alta. Entretanto, a natureza de código aberto do Resemble Enhance posiciona-o como uma força potencialmente disruptiva num mercado atualmente dominado por soluções proprietárias de alto custo.

A convergência da IA no melhoramento de áudio e vídeo abrirá provavelmente o caminho para soluções de restauro de multimédia mais abrangentes.

Combinando esta ferramenta com outros melhoradores de vídeo que utilizam IA generativa ou outros modelos para melhorar imagens e rostos – como o GPEN ou o conhecido GFPGan – os utilizadores podem agora obter resultados profissionais com os seus próprios computadores, com um investimento mínimo.

Para experimentar o Resemble Enhance, os utilizadores podem visitar o sítio Web oficial do Resemble AI ou descarregar os seus modelos a partir da página oficial do projeto no Github.

A Resemble AI, uma empresa que gera voz, promete restaurar o áudio antigo

Como funciona?

Not That Grok: Músico Grimes e OpenAI lançam brinquedo de peluche com IA no interior

Esta semana no Crypto Twitter: BONK simplesmente não desiste

Related Posts

Leave a Comment Cancel Reply