Home » Una startup di intelligenza artificiale può ora generare discorsi usando la voce in 30 lingue

Una startup di intelligenza artificiale può ora generare discorsi usando la voce in 30 lingue

by Patricia

La corsa agli armamenti dell’intelligenza artificiale continua ad accelerare e quasi ogni giorno emergono nuove frontiere nella clonazione della voce. L’ultimo sviluppo arriva dalla startup ElevenLabs, con sede a San Francisco, che ha appena annunciato che il suo nuovo modello di intelligenza artificiale è ora in grado di imitare le voci che parlano fluentemente in 30 lingue diverse, un’espansione drammatica rispetto alle otto originarie che erano supportate in precedenza.

L’azienda ha usato Lukeman Literary, un’agenzia letteraria ed editore indipendente, come esempio, spiegando che l’azienda produce ogni anno molti audiolibri in più lingue.

“In passato, il team di Lukeman impiegava settimane per produrre un singolo audiolibro, perché doveva trovare il giusto doppiatore, prenotare uno studio di registrazione, registrare e gestire la post-produzione”, ha dichiarato ElevenLabs in un post sul blog ufficiale. “Ora l’intero processo richiede poche ore”.

Secondo ElevenLabs, il nuovo modello Multilingual v2 offre un audio “ricco di emozioni” che cattura le sfumature del parlato naturale. Gli utenti digitano il testo che vogliono sia pronunciato nella lingua di destinazione e l’intelligenza artificiale genera una voce fuori campo senza soluzione di continuità.

L’azienda offre due opzioni principali di clonazione vocale: uno strumento di sintesi vocale e un “VoiceLab” per la clonazione di voci specifiche.

Gli utenti caricano campioni vocali per creare un clone di voce personalizzato, che l’intelligenza artificiale analizza per creare una versione sintetica. Questa voce clonata può poi essere manipolata per dire qualsiasi cosa si possa immaginare. ElevenLabs sostiene che con l’ultimo aggiornamento questi sosia dell’IA possono ora parlare fluentemente in lingue come lo svedese, l’arabo e il malese.

L’ampliamento delle capacità linguistiche coincide anche con l’uscita dalla fase di beta testing della tecnologia di clonazione vocale di ElevenLabs. L’azienda intende commercializzare lo strumento per applicazioni pratiche come la narrazione di audiolibri, come nel caso della Lukeman Literary.

Rispondere alle preoccupazioni

Il potenziale di abuso della tecnologia offusca queste ambizioni commerciali. L’audio deepfake lascia gli utenti vulnerabili alle frodi e alle campagne di disinformazione. La stessa ElevenLabs ha subito un contraccolpo l’anno scorso, quando la sua piattaforma è stata sfruttata per impersonare e molestare personaggi pubblici.

L’azienda afferma che da allora sono state implementate misure di salvaguardia più rigorose, ma le preoccupazioni etiche persistono. Come ha recentemente riportato TCN, “un truffatore potrebbe usare l’intelligenza artificiale per clonare la voce di un vostro caro”, e per ottenere risultati credibili basterebbero un paio di minuti di audio.

Grandi aziende tecnologiche come Meta devono affrontare critiche simili per aver sviluppato una potente IA generativa senza una piena trasparenza. Meta ha recentemente presentato uno strumento di sintesi vocale AI chiamato Voicebox, che, come ha riconosciuto, potrebbe facilmente facilitare i deepfakes. A differenza di ElevenLabs, Meta si è astenuta dal renderlo pubblico a causa dei “rischi di uso improprio”.

Tuttavia, nonostante i timori, i rapidi progressi nella clonazione vocale dell’intelligenza artificiale sembrano inarrestabili. Come ha dichiarato il linguista Mati Staniszewski di ElevenLabs, “alla fine speriamo di coprire ancora più lingue e voci con l’aiuto dell’IA e di eliminare le barriere linguistiche ai contenuti”.

Garantire un’implementazione etica rimane una sfida impegnativa, poiché la linea che separa la disinformazione globale dai modi innovativi di comunicare è molto sottile. È fondamentale agire con cautela, per evitare che il nostro villaggio globale di voci diventi una cacofonica Torre di Babele.

Related Posts

Leave a Comment