NvidiaとGoogle Cloudが10年以上の協業を基盤に、エージェントAIと物理AIの本格展開を支援する新プラットフォームを発表。Vera Rubinベースの新しいA5Xインスタンスにより、推論コストを最大10分の1に削減し、トークンスループットを10倍向上させる。
NvidiaとGoogle Cloudは10年以上にわたって協業し、パフォーマンス最適化ライブラリ・フレームワークからエンタープライズグレードのクラウドサービスまで、すべてのテクノロジーレイヤーを網羅するフルスタックAIプラットフォームを共同開発してきました。
この基盤により、開発者、スタートアップ、エンタープライズは、複雑なワークフローを管理するエージェントから工場フロアのロボットやデジタルツインまで、エージェントAIと物理AIを研究室から本番環境へ展開することが可能になります。
ラスベガスで開催されているGoogle Cloud Nextでは、パートナーシップが新たなマイルストーンを迎え、AI工場向けGoogle Cloud AI Hypercomputerを拡張するための新機能が発表されました。これにはNvidia Vera Rubinを搭載した新型A5Xベアメタルインスタンス、Nvidia BlackwellおよびNvidia Blackwell Ultra GPU上で動作するGoogle Geminiのプレビュー、Nvidia Blackwell GPU対応のConfidential VM、ならびにNvidia NemotronオープンモデルおよびNvidia NeMoフレームワークを活用したGemini Enterprise Agent Platformでのエージェントティックなイノベーションが含まれます。
次世代インフラ:Nvidia BlackwellからVera Rubinへ
Google Cloud Nextで、GoogleはNvidia Vera Rubin NVL72ラックスケールシステムを搭載したA5Xを発表しました。チップ、システム、ソフトウェア全体の極限の共設計により、トークンあたりの推論コストを前世代比で最大10分の1に削減し、メガワットあたりのトークンスループットを10倍向上させます。
A5XはNvidia ConnectX-9 SuperNICを使用し、次世代Google Virgoネットワークと組み合わせることで、単一サイトクラスタ内で最大80,000個のNvidia Rubin GPU、マルチサイトクラスタ内で最大960,000個のNvidia Rubin GPUにスケーリングでき、顧客が最大のAIワークロードをNvidia最適化インフラストラクチャ上で実行することを可能にします。
Google Cloudの人工知能・コンピュータインフラストラクチャ担当副社長兼ゼネラルマネージャーのMark Lohmeyer氏は、「Google Cloudでは、今後10年のAIは、顧客が真の統合型AI最適化インフラスタック上で最も要求の厳しいワークロードを実行する能力によって形作られると信じています。Google Cloudのスケーラブルなインフラと管理型AIサービスをNvidiaの業界トップクラスのプラットフォーム、システム、ソフトウェアと組み合わせることで、最先端モデルからオープンモデル、エージェントおよび物理AIワークロードまであらゆるものをトレーニング、チューニング、提供する柔軟性を顧客に提供し、パフォーマンス、コスト、持続可能性を最適化しています」とコメントしました。
Google Cloudの幅広いNvidia Blackwellポートフォリオは、Nvidia HGX B200システムを搭載したA4 VMからNvidia GB200 NVL72を搭載したラックスケールA4X VMおよびA4X Max Nvidiaまで対応しています。
