AnthropicセキュリティLLM

Anthropic独占のサイバーセキュリティ神話が崩壊、小型オープンモデルでも同等の脆弱性発見が可能

速報2026.04.18 13:31

Anthropicが独占的な能力を持つと主張していたClaude Mythosのサイバーセキュリティ機能について、小型のオープンソースモデルでも大部分の脆弱性分析が再現可能であることが、複数の独立した研究により明らかになった。

Anthropicは、サイバーセキュリティモデルClaude Mythosを厳重に管理下に置き、競合他社にはない能力を有していると主張していた。しかし新たな2つの研究により、小型のオープンに利用可能なモデルでも、Anthropicが公開した脆弱性分析の大部分を再現できることが示唆されている。

これら2つの独立した再現研究は、モデルの総体的なパフォーマンスに異議を唱えることなく、その排他的地位に疑問を呈している。

AISLEという企業は2025年半ばからオープンソースソフトウェアに対する独自のAI支援バグハンティングを実施している。AISLEはOpenSSLで15件、curlで5件の脆弱性を報告したと述べている。創業者のStanislav Fortは、Anthropicの公開サンプルからコードスニペットを抽出し、さまざまなモデルに投入して、より小型で部分的にオープンなモデルが単独でどの程度対応できるかを検証した。2番目の研究はVidoc Securityから提供されており、GPT-5.4とClaude Opus 4.6をオープンコーディングエージェントOpenCodeと組み合わせている。

Project Glasswingを通じて、Anthropicはその攻撃的能力を理由に、Claude Mythos Previewへのアクセスを11の組織からなるコンソーシアムに限定している。内部テストと英国のAI Security Instituteによる監査では、Mythosがソフトウェアバグを発見し、独立して動作するエクスプロイト（脆弱性攻撃）を構築し、ネットワークが「小規模で防御が弱く脆弱性がある」場合には企業ネットワーク全体を乗っ取ることができることが判明している。

FreeBSDバグも小型モデルが検出

Anthropicが自律的な発見と利用の事例として紹介したFreeBSD NFSバグ（CVE-2026-4747）について、AISLEがテストした8つのモデルすべてがこのメモリバグを問題の関数で検出した。これには、わずか36億個のアクティブパラメータを持つGPT-OSS-20bが含まれており、このモデルは100万トークンあたり0.11ドルで実行される。すべてのモデルが欠陥を重大度の高いものとしてフラグを立てたが、上書き可能なバッファサイズの推定値はわずかに異なった。

すべてのモデルは、オペレーティングシステムの主要な保護機構がここでは適用されない理由を理解しながら、バグを悪用する方法についても妥当な見方を提示した。GPT-OSS-120bは、AISLEが実際のエクスプロイトに近いと述べているガジェットシーケンス（exploit gadget chain）を生成した。Kimi K2でさえ、攻撃が感染したマシンから他のマシンに自動的に拡散する可能性があることを独自に発見し、これはAnthropicさえ言及していない詳細である。

創意性の側面でより難しくなる。実際のエクスプロイトは1,000バイト以上のペイロードを利用可能な約304バイトのスペースに詰め込む必要がある。Mythosはペイロードを15個の別々のネットワークリクエストに分割することでこれを達成した。

PR / 広告

すべてのWebサイトに AIアシスタントをつけよう。

✦YouTubeの要約やウェブサイトの分析など、使い方は無限大
✦最新AIモデルを1つに統合しコストを削減
✦500万人以上が利用する信頼のブランド

無料で始める

クーポンコードMERLIN20で20%オフ

LLM生成AIビジネス

Anthropic独占のサイバーセキュリティ神話が崩壊、小型オープンモデルでも同等の脆弱性発見が可能

関連記事

MistralがLe ChatをVibeに改名——メール・コード・レポートをこなす全機能型ワークエージェントへ

iPhoneユーザーが語る：車内アシスタントはAndroid AutoのGeminiがSiriより断然優れている理由

AIコンピュート競争が生んだ次世代チップメーカー——General ComputeとSambaNova連合の挑戦