開発者がGoogleのSynthIDという透かしシステムを逆算工学化したと主張。200枚のGemini生成画像と信号処理で透かしを除去または挿入できると述べたが、Googleはこの主張を否定している。
ソフトウェア開発者がGoogle DeepMindのSynthIDシステムを逆算工学化し、生成画像から人工知能の透かしを除去したり、他の作品に手動で挿入したりする方法を示したと主張している。Googleによればこの主張は事実ではないとのこと。
Aloshdennnyというユーザー名で活動する開発者はGitHubで作業内容をオープンソース化し、そのプロセスを文書化している。必要だったのは200枚のGemini生成画像、信号処理、そして「やたらと多くの自由時間」だけだと主張している。大麻の助けもあったようだ。
「ニューラルネットワークなし。専有アクセスなし」とAloshdennnyはMediumで述べた。「失業中に『純粋な黒』のAI生成画像を平均化すると、ゼロ以外のピクセルはすべて文字通り透かしが見つめ返してくるとわかった。」
SynthIDはGoogleのAIツールによって生成されたコンテンツにタグを付ける、ほぼ目に見えない透かしシステム。生成時に画像のピクセルに埋め込まれ、画像品質を低下させることなく除去が難しくなるよう設計されている。GoogleのNano BananaやVeo 3などのモデルから出力されたすべてのコンテンツにはSynthIDの透かしが付いており、YouTubeのAI生成クリエイタークローンにも適用されている。
Aloshdennnyは同システムを「本当に優れたエンジニアリング」と述べており、テスト時にはSynthIDを完全に除去することができず、代わりにSynthIDのデコーダを混乱させることに頼っていると述べている。
Googleの透かしの基礎となるメカニズムを破る過程は技術的には非開発者にとって複雑。詳細な説明に関心がある場合はAloshdennnyのMediumページで全容を確認できる(どうやら「いい気分で」書かれたようだ)が、以下は簡略化した説明。
Geminiを使って完全に黒または純白の画像200枚を生成。コントラストと彩度を強化し、その後彩度をノイズ除去して透かしパターンを露出させる。
パターンを平均化して各周波数における透かし信号の振幅と位相を見つける。
