Home » AIスタートアップが30ヶ国語の音声を生成可能に

AIスタートアップが30ヶ国語の音声を生成可能に

by Tim

AI軍拡競争は加速の一途をたどっており、音声クローンの新境地が毎日のように現れている。サンフランシスコを拠点とするスタートアップ企業ElevenLabsは、彼らの新しいAIモデルが30種類の言語で流暢に話す声を模倣できるようになったと発表した。


同社は、文芸エージェンシーであり独立系出版社であるルークマン・リテラリーを例に挙げ、同社は毎年多くのオーディオブックを多言語で制作していると説明した。

「以前は、1冊のオーディオブックを制作するのに、ルークマンのチームは数週間かかっていました。なぜなら、適切なナレーションアーティストを探し、レコーディングスタジオを予約し、録音し、ポストプロダクションを管理する必要があったからです」と、イレブンラボは公式ブログの投稿で述べている。「とイレブンラボは公式ブログ記事で述べている。

イレブンラボによると、新モデルのマルチリンガルv2は、自然な話し言葉のニュアンスの抑揚を捉えた「感情豊かな」音声を提供する。ユーザーがターゲット言語で話してほしいテキストを入力すると、AIがシームレスなナレーションを生成する。

同社は、音声合成ツールと特定の音声を合成する「ボイスラボ」の2つの主要な音声合成オプションを提供している。

ユーザーは音声サンプルをアップロードしてカスタム音声クローンを作成し、AIがそれを分析して合成版を作成する。このクローン化された音声は、想像できるものなら何でも言えるように操作することができる。イレブンラボは、最新のアップデートにより、このAIドッペルゲンガーはスウェーデン語、アラビア語、マレー語などを流暢に話せるようになったと主張している。

言語能力の拡張は、イレブンラブズが音声クローン技術をベータテストから脱却させたのと時を同じくしている。同社は、ルークマン・リテラリーのケースのように、オーディオブックのナレーションのような実用的な用途でこのツールを販売することを目指している

懸念への対応

技術が悪用される可能性は、こうしたビジネスの野心を曇らせる。ディープフェイク・オーディオは、ユーザーを詐欺や誤報キャンペーンに巻き込みやすくする。イレブンラボ自身も昨年、同社のプラットフォームが公人へのなりすましや嫌がらせに悪用され、反感を買った。

同社によると、その後、より厳格な安全対策が実施されているが、倫理的な懸念は依然として残っている。TCNが最近報じたように、「詐欺師はAIを使ってあなたの愛する人の声をクローンすることができる。

メタ社のような大手テック企業も、完全な透明性なしに強力な生成AIを開発しているとして、同様の批判に直面している。メタ社は最近、Voiceboxと呼ばれるAI音声合成ツールを発表したが、これはディープフェイクを容易に助長する可能性があることを認めている。イレブンラボとは異なり、メタ社は “悪用される危険性 “を考慮し、公開を控えた。

しかし、その懸念とは裏腹に、AIによる音声クローンの急速な進歩は止められないようだ。イレブンラボの言語学者マティ・スタニシェフスキ氏は、「最終的には、AIの助けを借りてさらに多くの言語と音声をカバーし、コンテンツに対する言語的障壁をなくしたいと考えています」と述べている。

世界的な誤報と革新的なコミュニケーション方法の境界線は非常に薄いため、倫理的な実装を保証することは依然として険しい課題である。グローバルな声の村が不協和音のバベルの塔にならないよう、慎重に行動することが重要だ。

Related Posts

Leave a Comment