Anthropicが限定公開するClaude Mythosの脆弱性発見能力について、2つの独立した研究がより小規模でオープンなモデルでも同様の成果を再現できることを示唆。Mythosの独占的な優位性に疑問が生じている。
Anthropicは、Claude Mythosのサイバーセキュリティ能力について、競合他社には達成不可能な機能があると主張し、Project Glasswingを通じて11の団体のコンソーシアムのみにアクセスを制限している。内部テストとイギリスのAI Security Instituteによる監査では、Mythosがソフトウェアバグの発見、独立した動作するエクスプロイト(exploit)の構築、ネットワークが「小規模で防御が弱く脆弱性を持つ」限定条件下での企業ネットワーク全体の乗っ取りが可能であることが確認されている。
2つの独立した再現研究が、Anthropicが公開したこの独占的なストーリーに疑問を投げかけている。ただし、モデルの全体的なパフォーマンスについては異論を唱えていない。
AISLEは2025年半ばからオープンソースソフトウェアに対するAI支援型のバグ狩りを実施している企業である。AISSLEは、Anthropicの公開サンプルからコードスニペットを抽出し、より小規模で部分的にオープンなモデルがどの程度独立して再現できるかをテストした。同社はOpenSSLで15件、curlで5件の脆弱性を報告している。創業者のStanislav Fortは、さまざまなモデルに対してコード分析を実施した。もう1つの研究はVidoc Securityから発表され、GPT-5.4とClaude Opus 4.6をオープンコーディングエージェントOpenCodeと組み合わせて検証した。
Anthropicが注目させたFreeBSD NFSバグ(CVE-2026-4747)は、Mythosによる自律的な発見と悪用のショーケースとして位置付けられていた。AISSLEがテストした8つのモデルすべてが、当該関数のメモリバグを検出した。これには、わずか36億個のアクティブパラメータを持つGPT-OSS-20bが含まれており、100万トークンあたり0.11ドルで動作する。すべてのモデルが脆弱性を重大度が高いものとして指摘したが、上書き可能なバッファサイズの推定値はわずかに異なった。
すべてのモデルはまた、バグの悪用方法についてもっともらしい説明を提示し、なぜOSの主要な保護機構がここでは適用されないのかを解明した。GPT-OSS-120bは、AISSLEが実際のエクスプロイトに近いとしたガジェットシーケンスを生成した。Kimi K2は、攻撃が感染したマシンから別のマシンへ自動的に拡散する可能性があることを独自に突き止めたが、これはAnthropicが言及していない詳細である。
難しいのは創意工夫の側面である。実際のエクスプロイトは、1,000バイト以上のペイロードを利用可能な約304バイトのスペースに詰め込む必要がある。Mythosはペイロードを15個の個別ネットワークリクエストに分割することでこれを達成した。
