OpenAIはCodexを大幅アップデートし、PC上のアプリを直接操作できる「computer use」機能を導入した。Webツール連携の強化や画像生成モデルとの統合により、コーディング支援にとどまらない汎用作業エージェントへと進化した。
米OpenAIは4月16日(現地時間)、コーディングエージェント「Codex」の大幅アップデートを発表した。従来のコード生成支援から、PC操作や外部ツール連携を含めた「汎用作業エージェント」としての機能強化が実現された。
最大の変更点は、ユーザーのPC上のアプリを直接操作できる「computer use」機能の導入である。Codexは画面を認識し、自らカーソル操作や入力を行い、アプリの起動や操作を実行できるようになった。複数のエージェントを並列で動作させることも可能で、ユーザーの作業を妨げずにバックグラウンドでタスクを進められる。APIが用意されていないアプリやフロントエンドのテスト作業にも対応できるようになる。
Webや各種ツールとの連携も大幅に強化された。アプリ内ブラウザを備え、Webページ上に直接コメントして指示を与えられるほか、JIRAやGitLab、Microsoftの製品群などと連携する90以上のプラグインが追加された。開発管理やCI/CD、データ基盤など、開発ワークフロー全体を横断した作業が可能になる。
生成機能も拡張された。画像生成モデル「gpt-image-1.5」との統合により、コードと画像を組み合わせたUI設計やモックアップ作成が同一環境で行える。ユーザーの操作履歴や設定を記憶するメモリ機能や、継続的・反復的な作業を自動化する機能も追加され、より長期的なタスク実行に対応する。
開発者向けには、GitHubのレビューコメントへの対応、複数ターミナルの同時利用、SSH経由でのリモート開発環境接続(α版)などが導入された。ファイルのプレビュー表示やエージェントの計画・進行状況を可視化するサマリーパネルも備え、開発プロセス全体の効率化を支援する。
これらのアップデートは同日から、ChatGPTアカウントでログインしたCodexのデスクトップアプリ(MacおよびWindows)ユーザー向けに順次提供される。PC操作機能は当初macOSでのみ利用可能で、今後EUや英国などにも展開予定。メモリなどのパーソナライズ機能はEnterprise、Eduユーザー、欧州・英国ユーザー向けに順次提供される見込みだ。
