OpenAILLM生成AI

GPT-5.5を10項目でテスト：93点獲得、過度な積極性が減点要因

速報2026.04.24 15:10

OpenAIが公開したGPT-5.5は、コーディング、概念の明確性、科学研究能力で改善を示した。ZDNetの10項目テストでは93点を獲得したが、指示以上の仕事をする過度な積極性が課題として浮かび上がった。

OpenAIはGPT-5.5を公開し、GPT-4より優れた性能と高速処理を実現している。新しい大規模言語モデルは、エージェント型コーディング、概念の明確性、科学研究能力、知識作業時の正確性において改善を示している。

このリリースは、AI画像生成を組み合わせたChatGPT Images 2.0の発表に続くものであり、GPT-4のリリース発表からそう遠くない時期での公開となっている。

OpenAIのリリーススケジュールは劇的に加速しており、これはAIコーディングがOpenAIの開発時間を大幅に短縮したことが要因と考えられる。

このグラフはChatGPT 5.5 Thinkingを使用してImages 2.0で作成されたもので、筆者はGPTにGPTリリース間のリリースペースを可視化し、ZDNetのブランドスタイルで表示することを指示しただけである。ZDNetのロゴのPNGも提供した。修正作業を含めて、全プロセスは10分以内に完了した。コンピュータグラフィックスの発明以来、筆者は手作業でこのような専門的で見栄えの良い情報グラフを作成してきたが、同様のグラフ作成には最低でも2時間を要していた。

Images 2.0の機能についてはすでにテストを実施しており、詳細は来週報告する予定である。本記事ではGPT-5.5の知識能力に焦点を当てている。

筆者の10項目テスト方法でGPT-5.5を検証した結果、印象的である一方で、若干の不満も感じた。結果は堅実だったが、モデルは指示していない仕事をする過度な積極性を示す傾向があった。

GPT-5.5は有料プラン以上でのみ利用可能であるため、ChatGPT Plusでテストを実施した。現在、Plus アカウントではStandardおよびExtendedの両方のThinking努力レベルでGPT-5.5が利用可能である。Standard Thinkingを選択し、これらのテストで使用した。

テスト1：ニュース記事の要約

利用可能なポイント：

PR / 広告

すべてのWebサイトに AIアシスタントをつけよう。

✦YouTubeの要約やウェブサイトの分析など、使い方は無限大
✦最新AIモデルを1つに統合しコストを削減
✦500万人以上が利用する信頼のブランド

無料で始める

クーポンコードMERLIN20で20%オフ

LLM生成AIビジネス

GPT-5.5を10項目でテスト：93点獲得、過度な積極性が減点要因

関連記事

MistralがLe ChatをVibeに改名——メール・コード・レポートをこなす全機能型ワークエージェントへ

iPhoneユーザーが語る：車内アシスタントはAndroid AutoのGeminiがSiriより断然優れている理由

AIコンピュート競争が生んだ次世代チップメーカー——General ComputeとSambaNova連合の挑戦