Home » La startup di generazione vocale Resemble AI promette di ripristinare il vecchio audio

La startup di generazione vocale Resemble AI promette di ripristinare il vecchio audio

by Patricia

Mentre molte aziende che si occupano di AI cercano di trovare il modo di utilizzare la tecnologia per migliorare o addirittura creare video, Resemble AI si concentra sulla fedeltà dell’audio. La startup, che offre anche un generatore di voci AI che le aziende possono utilizzare per creare voci realistiche simili a quelle umane, ha lanciato “Resemble Enhance”, uno strumento open-source progettato per migliorare in modo significativo la qualità dell’audio storico.

Il nuovo servizio è in grado di prendere una registrazione distorta e sfocata di un discorso storico perso da tempo e di applicare l’intelligenza artificiale per farlo sembrare registrato o trasmesso ieri.

L’azienda canadese afferma che Resemble Enhance si distingue per il suo approccio a doppio modulo, che combina un sofisticato denoiser – che rimuove i ronzii e i sibili statici di sottofondo – e un potenziatore del parlato alimentato dall’intelligenza artificiale. Questa combinazione non solo rimuove il rumore indesiderato, ma arricchisce anche la qualità complessiva dell’audio.

Anche se esistono altri prodotti per il restauro audio sul mercato, la combinazione di tecniche di Resemble potrebbe rappresentare un significativo elemento di differenziazione.

Come funziona?

Il denoiser Resemble AI utilizza UNet, un modello di intelligenza artificiale che aiuta a separare i diversi tipi di suoni presenti in una registrazione. È in grado di filtrare i rumori indesiderati dalle tracce audio, lasciando solo il parlato come punto focale.

Una volta che UNet ha fatto il suo lavoro, entra in gioco il modulo enhancer, che estende la larghezza di banda audio e corregge le distorsioni. Questa doppia funzionalità, secondo l’azienda, garantisce che l’output finale non solo sia privo di rumore, ma possieda anche la ricchezza delle registrazioni contemporanee.

Essendo uno strumento open-source, Resemble Enhance è accessibile a costo zero, un’opzione interessante nel mercato tradizionalmente costoso dei servizi di restauro dei media. I principali beneficiari di Resemble Enhance sono i settori che fanno affidamento su una qualità audio chiara, come il podcasting, l’intrattenimento e l’istruzione. Inoltre, questo strumento offre una nuova vita alle registrazioni storiche, fornendo potenzialmente una visione più chiara del passato.

Il rilascio di questo strumento avviene in un momento in cui la domanda di contenuti digitali di alta qualità è ai massimi storici. Nel frattempo, la natura open-source di Resemble Enhance lo posiziona come una forza potenzialmente dirompente in un mercato attualmente dominato da soluzioni proprietarie ad alto costo.

La convergenza dell’intelligenza artificiale nel miglioramento dell’audio e del video aprirà probabilmente la strada a soluzioni di restauro dei media più complete.

Combinando questo strumento con altri miglioratori video che utilizzano l’intelligenza artificiale generativa o altri modelli per ingrandire e migliorare le immagini e i volti, come GPEN o il noto GFPGan, gli utenti possono ora ottenere risultati professionali con il proprio computer, con un investimento minimo.

Per sperimentare Resemble Enhance, gli utenti possono visitare il sito web ufficiale di Resemble AI o scaricare i modelli dalla pagina Github ufficiale del progetto.

Related Posts

Leave a Comment