AIモデルの性能ランキングで米国と中国がほぼ同等の水準に到達し、競争軸がコストと信頼性にシフト。両国は異なる優位性を持ち、米国はデータセンター数で圧倒的だが、中国は研究論文数で上回っている。
米国と中国がほぼ互角の競争状態にある
コミュニティが運営するランキングプラットフォーム「Arena」によると、大規模言語モデル(LLM)の性能で米国と中国がほぼ並び立つ状況にある。このプラットフォームでは、同じプロンプトに対する出力を比較できる。2023年初期にはOpenAIのChatGPTが優位にあったが、2024年にはGoogleとAnthropicが独自モデルを発表したことでその差は縮小した。2025年2月には、中国のラボDeepSeekが構築したAIモデル「R1」が米国トップのChatGPTと互角の性能を一時的に示した。2026年3月現在、Anthropicが首位を占め、xAI、Google、OpenAIが緊密に続いている。DeepSeekやAlibabaといった中国モデルの遅れは僅かである。最高性能のAIモデル間の順位差が極めて微小な状況では、各社はコスト、信頼性、実世界での有用性で競争するようになっている。
このランキングから、米国と中国が異なるAI優位性を持つことが明らかになった。米国はより高性能なAIモデル、豊富な資本、推定5,427のデータセンター(他国の10倍以上)を有している一方で、中国はAI関連の研究論文、特許、ロボット工学で優位性を持つ。
競争が激化するなか、OpenAI、Anthropic、Googleといった企業は訓練コード、パラメータ数、データセットサイズをもはや公開していない。南カリフォルニア大学のコンピュータ科学者で報告書の共著者であるYolanda Gilは「モデルの振る舞いを予測することについて、私たちは多くのことを知らない」と述べている。この透明性の欠如により、独立系研究者がAIモデルをより安全にする方法を研究することが困難になっているという。
AIモデルは超高速で進化を続けている
開発が停滞するという予測にもかかわらず、AIモデルは一貫して改善を続けている。複数の指標では、博士号レベルの科学、数学、言語理解を測定するテストで、人間の専門家の性能に匹敵するか、これを上回るようになった。AIモデル向けソフトウェアエンジニアリングベンチマーク「SWE-bench Verified」では、トップスコアが2024年の約60%から2025年ではほぼ100%へと急上昇した。2025年には、AIシステムが独力で天気予報を作成した。
「この技術が継続的に改善し、全く停滞していないことに驚愕している」とGilは述べている。
しかし、AIは多くの他の領域ではいまだに苦戦している。モデルは膨大なテキストと画像を処理することで学習し、物理世界を経験することができないため、AIは「ギザギザした知能」を示す。ロボットはいまだ初期段階にあり、家事の12%でしか成功していない。自動運転車はより進展しており、Waymoの車両は現在、街を走行している。
