AnthropicがサイバーセキュリティAIモデル「Mythos」の厳格なテスト公開を進める中、許可されていない小規模グループが開始当日からアクセスしていたことが判明した。単純な推測とMercorの侵害から得た情報を組み合わせた手口で、AI安全性を謳う同社の信頼性が問われている。
Anthropicが綿密に管理していたClaude Mythosのロールアウトが尴尬な展開を迎えた。数週間にわたってこのAIモデルはサイバーセキュリティに優れており公開するには危険すぎると主張していたのに対し、結果として許可されていないユーザーの手に落ちてしまった。
Bloombergによると「許可されていない小規模グループ」が、存在が流出で初めて明かされたMythosに、Anthropicがテスト対象企業への提供計画を発表した当日からアクセスしていたという。Anthropicは調査中だとしている。AI安全性を真剣に考えていることを企業イメージの中核としながら、サイバーセキュリティを謳う企業にとって、これは極めて不体裁な事態である。
技術的観点から見ると、Mythosの侵害は極めて単純だった。BloombergによるとこのグループはMythosへのアクセスに「モデルのオンライン上の場所についての推測」を用いており、Mercorという企業の侵害で露出したAnthropicの他のモデルに関する情報を利用していた。Mercorはデータに関する企業だ。加えて、あるメンバーがAnthropicモデルの評価に関する契約業務を通じてアクセス権を持っていた。このグループは洗練された技術的攻撃や大規模なモデル窃盗ではなく、内部知識とまぐれ当たりの推測の組み合わせでMythosへの不正アクセスを獲得した。
セキュリティ脆弱性は避けられないものであり、情報を流出させたのはAnthropicではなくMercorである。英国シンクタンク王立防衛研究所(RUSI)のリサーチフェローであるPia Hüschは、どの企業も完全には安全ではなく人間が最も脆弱な環階であると述べたが、「深刻な結果がなかったことは当初は幸運に見える」とコメントした。
Anthropicは「十分に予想可能な」失敗を予測できなかった
しかし、これは単なる不運ではない。このような推測による侵入は非常に標準的なハッキング技術であり、Mercorの侵害はMythosのリリース前から既に認識されていた。セキュリティ研究者のLukasz Olejnikはこれを、サイバーセキュリティ業界がこの20年間定期的に対処してきた「十分に予想可能な」失敗として説明している。したがってAnthropicはこれを予測し、対策を講じるべきだった。
Anthropicはまた侵害を検出する手段を備えていたと思われる。同社は「モデルの使用をログして追跡する」ことができるとOlejnikは述べており、特にMythosのロールアウトが極めて限定的であるはずだったため、許可されていない、または悪意のあるアクセスを停止することが可能であるべきだった。明らかにAnthropicは十分に綿密に監視していなかった。
