xAIが廉価で高性能なGrok 4.3をリリースした。入力コスト約40%、出力コスト約60%削減され、Web検索やコード実行などの機能を備える。同時にクリエイティブプロジェクト向けのAgent Modeも発表された。
xAIはGrok 4.3をリリースした。xAI開発者のEric Jiangによれば、Grok 4.3は開発者とビジネスを対象に設計され、速度、低コスト、ツール呼び出し機能に重点を置いている。このモデルはWeb検索、X検索、Pythonコード実行、ファイル検索(RAG)を独自に処理でき、Excelファイル、PDF、PowerPointデッキを生成することができる。
Grok 4.3は毎秒100トークンで実行され、100万トークンのコンテキストウィンドウを備えている。
独立したベンチマーク提供業者のArtificial Analysisによれば、Grok 4.3はIntelligence Indexで53の得点を獲得した。これはMuse SparkおよびClaude Sonnet 4.6をわずかに上回っている。
Grok 4.20と比較して、入力コストは約40%、出力コストは約60%削減された。これによりGrok 4.3はArtificial Analysisが「Pareto frontier」と呼ぶ領域に位置づけられ、パフォーマンスとコストが最適に整合している。完全なベンチマーク実行コストは395ドルで、GPT-5.5の3,959ドルおよびClaude Opus 4.7の4,811ドルと比較して大幅に低い。
実務的なナレッジワークタスクでのAIパフォーマンスを測定しようとするGDPval-AAベンチマークでは、Grok 4.3のEloスコアは321ポイント上昇して1,500となった。これはGoogleのGemini 3.1を上回っているが、OpenAIのGPT-5.5はなお276ポイント高くリードしている。
他のベンチマークはより厳しい評価を下している。スナック自動販売機を運用するAIモデルをテストするAndon Labsは、自律エージェントタスクで課題があることを報告している。モデルがアクティブに行動せずに待機状態に陥ることがあるとのことである。
xAIはまた、Grok Imaginationの新しいAgent Modeもリリースした。現在Grok Webインターフェースでベータ版として提供されている。Agent Modeは単一の入力ではなく複数のステップを実行できる。
Agent ModeはGrok Webインターフェースを通じてアクセス可能で、左下の入力フィールドでオンにすることができる。有料アカウントが必要である。
