Anthropicが独占的な能力を持つと主張していたClaude Mythosのサイバーセキュリティ機能について、小型のオープンソースモデルでも大部分の脆弱性分析が再現可能であることが、複数の独立した研究により明らかになった。
Anthropicは、サイバーセキュリティモデルClaude Mythosを厳重に管理下に置き、競合他社にはない能力を有していると主張していた。しかし新たな2つの研究により、小型のオープンに利用可能なモデルでも、Anthropicが公開した脆弱性分析の大部分を再現できることが示唆されている。
これら2つの独立した再現研究は、モデルの総体的なパフォーマンスに異議を唱えることなく、その排他的地位に疑問を呈している。
AISLEという企業は2025年半ばからオープンソースソフトウェアに対する独自のAI支援バグハンティングを実施している。AISLEはOpenSSLで15件、curlで5件の脆弱性を報告したと述べている。創業者のStanislav Fortは、Anthropicの公開サンプルからコードスニペットを抽出し、さまざまなモデルに投入して、より小型で部分的にオープンなモデルが単独でどの程度対応できるかを検証した。2番目の研究はVidoc Securityから提供されており、GPT-5.4とClaude Opus 4.6をオープンコーディングエージェントOpenCodeと組み合わせている。
Project Glasswingを通じて、Anthropicはその攻撃的能力を理由に、Claude Mythos Previewへのアクセスを11の組織からなるコンソーシアムに限定している。内部テストと英国のAI Security Instituteによる監査では、Mythosがソフトウェアバグを発見し、独立して動作するエクスプロイト(脆弱性攻撃)を構築し、ネットワークが「小規模で防御が弱く脆弱性がある」場合には企業ネットワーク全体を乗っ取ることができることが判明している。
FreeBSDバグも小型モデルが検出
Anthropicが自律的な発見と利用の事例として紹介したFreeBSD NFSバグ(CVE-2026-4747)について、AISLEがテストした8つのモデルすべてがこのメモリバグを問題の関数で検出した。これには、わずか36億個のアクティブパラメータを持つGPT-OSS-20bが含まれており、このモデルは100万トークンあたり0.11ドルで実行される。すべてのモデルが欠陥を重大度の高いものとしてフラグを立てたが、上書き可能なバッファサイズの推定値はわずかに異なった。
すべてのモデルは、オペレーティングシステムの主要な保護機構がここでは適用されない理由を理解しながら、バグを悪用する方法についても妥当な見方を提示した。GPT-OSS-120bは、AISLEが実際のエクスプロイトに近いと述べているガジェットシーケンス(exploit gadget chain)を生成した。Kimi K2でさえ、攻撃が感染したマシンから他のマシンに自動的に拡散する可能性があることを独自に発見し、これはAnthropicさえ言及していない詳細である。
創意性の側面でより難しくなる。実際のエクスプロイトは1,000バイト以上のペイロードを利用可能な約304バイトのスペースに詰め込む必要がある。Mythosはペイロードを15個の別々のネットワークリクエストに分割することでこれを達成した。
