OpenAIは複数のツールを自律的に操作できるエージェント型モデル「GPT-5.5」を発表しました。コード作成・デバッグ、ウェブ検索、データ分析などに特化しており、API価格は従来比で2倍に設定されています。
OpenAIは「GPT-5.5」を発表し、これを「実務作業向けおよびエージェント駆動の新しいクラスのインテリジェンス」と称しています。このモデルは複雑な目標を理解し、ツールを使用し、独自の出力をチェックし、完了するまでタスクに自律的に取り組むよう設計されています。現在、有料のChatGPTおよびCodexユーザーが利用可能です。
エージェント型ワークフローが主な売りポイント
OpenAIによると、GPT-5.5は特にコード作成とデバッグ、ウェブ検索、データ分析、ドキュメント作成に強みを持っています。
エージェント型ワークフロー向けのコーディングベンチマークであるTerminal-Bench 2.0では、GPT-5.5は82.7%のスコアを獲得しており、これは前世代より7.6ポイント上回っています。
より複雑な数学問題ではさらにギャップが広がります。
OpenAIは、GPT-5.5がこうしたパフォーマンス向上を速度を犠牲にすることなく実現していると述べています。このモデルは従来比でGPT-5.4のトークンあたりのレイテンシ(遅延)と同等を保ちながら、同じCodexタスク完了に要するトークン数を大幅に削減しているとのことです。
長文対応性能も向上しています。
ただし、優位性は絶対的ではありません。SWE-Benchではスコアが期待ほど伸びていません。
Scale AIが実施するツール利用ベンチマークのMCP Atlasでは、GPT-5.5は75.3%のスコアを獲得しており、Claude Opus 4.7(79.1%)およびGemini 3.1の両者に後れを取っています。
また、44職種にわたる実務的なタスク性能を測定するためのベンチマークであるGDPvalでは、GPT-5.5は84.9%のスコアを記録しており、わずかな改善にとどまっています。
このモデルはNVIDIA GB200およびGB300-NVL72システムと連携して開発・最適化されました。OpenAIは、GPT-5.5とCodexが同社独自の提供インフラストラクチャの最適化を支援したと述べています。Codexは同社のインフラを分析しました。
標準モデルに加えて、OpenAIはGPT-5.5の別バージョンも提供開始しています。
現在のところ、OpenAIはGPT-5.5に関する情報のみを共有しています。
サイバーセキュリティ能力は「高」と評価
OpenAIはGPT-5.5の生物学、化学、およびサイバーセキュリティ関連の能力を「高」に分類しています。
同時に、OpenAIはサイバーリスクの可能性に対するより厳格な分類器をロールアウトしており、当初はより多くの却下につながる可能性があると同社は述べています。サイバーセキュリティ向けの信頼できるアクセスプログラムが進められています。
有料ユーザーが最初にアクセス可能、API価格は
GPT-5.5 Thinkingは現在、Plus、ProおよびTeamユーザーが利用できます。
APIについては、OpenAIは入力トークンあたり100万につき5ドル、出力トークンあたり100万につき30ドルの料金を設定しており、コンテキストウィンドウは設定されています。
