スタンフォード大学の『AI Index Report 2026』は、AI モデルが博士号レベルの科学問題や数学競技で人間を上回るなど性能が大幅に向上する一方で、米国と中国の格差がほぼ消滅し、安全上の問題が増加していること、そして一般の信頼が低下していることを記録している。
スタンフォード大学人間中心AI研究所(Stanford HAI)の『AI Index Report 2026』は、人工知能の年間評価レポートであり、研究、産業、社会への影響を追跡している。
今年版は技術がいかに進化したかを示している。AIモデルは現在、博士号レベルの科学問題と競技レベルの数学で人間のベースラインを上回っている。SWE-bench Verified コーディングベンチマークでは、パフォーマンスが1年間で60%からほぼ100%に跳ね上がったと報告書は述べている。
Googleの Gemini Deep Think は国際数学オリンピックで金メダルを獲得した。しかし、この進歩にもかかわらず、「ギザギザした前線」(jagged frontier)現象は依然として存在している。同じトップティアモデルでさえ、アナログ時計を正しく読むことができるのはわずか50.1%の確率である。
米国と中国の性能格差は本質的に消滅したと報告書は述べている。2025年初頭から、両国のモデルは次々とトップの座を交代してきた。2026年3月時点で、Anthropic の主導モデルは わずか2.7%の優位性を保持している。中国は論文発表数、引用数、産業用ロボティクスで優位を占め、米国はトップモデルの数と投資で主導権を保有している:2025年には民間AI投資に2,859億ドルが流入し、中国の23倍である。しかし、米国への AI 研究者の移動は2017年以来89%減少している。
生産性向上は新卒レベル求人の減少をもたらす
報告書は顧客サポートとソフトウェア開発で14~26%の生産性向上、マーケティングチームで最大72%の向上を記録している。より判断が必要なタスクでは、効果は弱いか負の結果さえ示している。ビジネス全体でのAIエージェント採用は、ほぼすべての部門で1桁台にとどまっている。
このストーリーには別の側面がある。計測された生産性向上が最も大きいソフトウェア開発分野では、22~25歳の米国開発者の雇用は2024年以降ほぼ20%減少した。一方、より年配の開発者の数は増加し続けている。
50%以上の採用、しかし教育は追いつかず
生成AI は3年以内に人口の53%に到達し、パソコンやインターネットのいずれよりも速く普及したと報告書は述べている。
より若い世代では採用率はさらに高い。
