生成AIAnthropicGoogleAIセーフティビジネス

スタンフォード AI Index 2026：性能急進と安全懸念の拡大、公的信頼の低下

速報2026.04.14 14:48

スタンフォード大学のAI Index Report 2026によると、AIモデルの性能は博士号レベルの科学問題や数学競技問題で人間を上回る水準に達した一方で、米国と中国の性能格差は急速に縮まり、安全問題は増大し、公的信頼は低下し続けている。

スタンフォード大学の人間中心型AI研究所（Stanford HAI）が発表したAI Index Report 2026は、人工知能の研究、産業、社会への影響を追跡する年次評価報告書である。

テクノロジーの進化を示す成果は目覚ましい。AIモデルは現在、博士号レベルの科学問題と競技レベルの数学でベースラインとなる人間の性能を上回っている。SWE-bench Verifiedコーディングベンチマークでは、わずか1年間でパフォーマンスが60パーセントから100パーセント近くに跳躍したとこの報告書は述べている。

GoogleのGemini Deep Thinkは国際数学オリンピックで金メダルを獲得した。しかし、この著しい進歩にもかかわらず、「ギザギザの境界線（jagged frontier）」現象は依然として存在している。同じ最高級のモデルであっても、アナログ時計を正しく読み取る確率はわずか50.1パーセントに過ぎない。

この報告書によると、米国と中国の性能格差は本質的になくなった。2025年初頭以降、両国のモデルは首位の座を何度も交換している。2026年3月時点では、Anthropicの最先端モデルがわずか2.7パーセントの優位性を保つに留まっている。中国は論文発表数、引用数、産業用ロボティクスで優位を占めている一方で、米国はトップモデルの数と投資額で主導権を握っている。2025年民間AI投資として285.9億ドルが米国に流入し、中国への投資の23倍となっている。しかし、米国に移住するAI研究者の数は2017年以来89パーセント低下している。

生産性向上の裏側：初級職の雇用減少

この報告書は、カスタマーサポートとソフトウェア開発で14～26パーセント、マーケティングチームでは最大72パーセントの生産性向上を記録している。より判断力を要する業務については、効果はより弱いか、むしろ負の影響さえある。ビジネス全体でのAIエージェントの採用は、ほぼすべての部門で一桁パーセンテージのままである。

この成功には別の側面がある。測定された生産性向上が最も強いソフトウェア開発において、米国の22～25歳の開発者の雇用は2024年以降ほぼ20パーセント低下した。一方、年配の開発者の数は増え続けている。

50パーセントを超える採用率、だが教育が追いつかない

生成AIは3年以内に人口の53パーセントに到達し、パソコンやインターネットのいずれよりも急速に普及したと、この報告書は述べている。

若年層の間では採用率はさらに高い。

PR / 広告

すべてのWebサイトに AIアシスタントをつけよう。

✦YouTubeの要約やウェブサイトの分析など、使い方は無限大
✦最新AIモデルを1つに統合しコストを削減
✦500万人以上が利用する信頼のブランド

無料で始める

クーポンコードMERLIN20で20%オフ

LLM生成AIビジネス

スタンフォード AI Index 2026：性能急進と安全懸念の拡大、公的信頼の低下

関連記事

MistralがLe ChatをVibeに改名——メール・コード・レポートをこなす全機能型ワークエージェントへ

iPhoneユーザーが語る：車内アシスタントはAndroid AutoのGeminiがSiriより断然優れている理由

AIコンピュート競争が生んだ次世代チップメーカー——General ComputeとSambaNova連合の挑戦