Home » インビジブル・インク:研究者らがAI生成コンテンツの電子透かしの弱点を分析

インビジブル・インク:研究者らがAI生成コンテンツの電子透かしの弱点を分析

by Tim

ディープフェイクの蔓延は重大なリスクをもたらす。未成年者のヌード画像の作成から、有名人のディープフェイクを使った詐欺的プロモーションまで、人工知能が生成したコンテンツ(AIGC)と人工のコンテンツを見分ける能力は、かつてないほど重要になっている


文書や通貨における一般的な偽造防止策である電子透かしは、そのようなコンテンツを識別する方法の1つであり、AIが生成した画像とAIが生成していない画像を区別するのに役立つ情報が付加されている。しかし、最近の研究では、AIが作成したものを人間が作成したものとして公表することに伴うリスクを防ぐには、単純な、あるいは高度な透かしの方法だけでは十分ではない可能性があると結論づけている。

この研究は、南洋理工大学、S-Lab、NTU、重慶大学、Shannon.AI、浙江大学の科学者チームによって行われた。

著者の一人であるLi Guanlin氏はTCNに対し、「電子透かしは、コンテンツがAIによって生成されたものなのか、それとも人間によって生成されたものなのかを知るのに役立つ」と述べた。しかし彼は、『もしAIGCの電子透かしが削除や改ざんが容易であれば、電子透かしを追加することでAIが作成した作品であると人々に信じさせたり、電子透かしを削除することで人間が作成したAIGCであると人々に信じさせたりすることが自由にできる』と付け加えた。

この論文では、現在の電子透かし方式の様々な脆弱性を探った。

「AIGC用の電子透かし方式は、秘密鍵を知らなくても電子透かしを除去できる敵の攻撃に対して脆弱である。この脆弱性は、特にAIが生成したコンテンツの誤報や悪意ある利用に関して、現実の世界に影響を及ぼす。

「一部の悪意のあるユーザーが、電子透かしを削除した後にAIが生成した有名人の偽画像を拡散した場合、十分な証拠がないため、その画像がAIによって生成されたことを証明することは不可能です」とLi氏はTCNに語った。

李氏と彼のチームは、AIが生成したコンテンツに対する現行の電子透かしの復元力と完全性をテストするために、一連の実験を行った。透かしを除去したり改ざんしたりするためにさまざまな技術を適用し、それぞれの方法の容易さと有効性を評価した。その結果、電子透かしは比較的簡単に改ざんできることがわかった。

研究で使用された攻撃プロセス。Image: Arvix

研究で使用された攻撃プロセス。Image: Arvix


さらに、これらの脆弱性が実世界に及ぼす潜在的な影響、特にAIが生成したコンテンツの誤報や悪意のある利用のシナリオについて評価した。これらの実験と分析の累積結果は、より堅牢な電子透かしメカニズムが緊急に必要であるという結論に至った。

OpenAIなどの企業は、AIが生成したコンテンツを99%の精度で検出する方法を開発したと発表しているが、全体的な課題は残っている。メタデータや目に見えない電子透かしといった現在の識別方法には限界がある。

Li氏は、「AIGCを保護するためには、デジタル署名のようないくつかの暗号化手法を既存の電子透かし方式と組み合わせるのがよい」と提案しているが、正確な実装はまだ不明だ。

他の研究者は、より極端なアプローチを提案している。TCNが最近報じたように、マサチューセッツ工科大学(MIT)のチームは、人工知能モデルのために画像を「毒」に変えることを提案している。毒を盛った」画像を訓練データセットの入力として使用すると、最終的なモデルは、人間の目には見えないが訓練プロセスでは非常に影響力のあるディテールを拾ってしまうため、否定的な結果を出すことになる。それは、学習モデルを殺す致命的な透かしのようなものだ。

オープンエーアイのCEOであるサム・アルトマンが指摘するように、AIの急速な進歩は、AIが本来持っている思考プロセスが人間の論理や直感を反映する未来を示唆している。このような進歩に伴い、電子透かしのような強固なセキュリティ対策の必要性がさらに高まっている。

李氏は、「電子透かしやコンテンツ・ガバナンスは、実際には通常のユーザーには影響を与えないため、必要不可欠である」と考えているが、クリエイターと敵対者の対立は依然として続いている。「それは常に猫とネズミのゲームです。だからこそ、電子透かしのスキームを更新し続ける必要があるのです」

Related Posts

Leave a Comment