Anthropicが実施した実験で、強力なAIモデル「Claude Opus 4.5」を使用したエージェントが、より弱いモデルを使用したエージェントとの取引で測定可能な優位性を示しました。敗者は自分が不利な条件で取引していることに気づかないという懸念が浮上しています。
Anthropicは1週間の実験でClaudeエージェントに従業員向けの売買取引を行わせました。その結果、より強力なモデルが良い条件で取引を成立させることが判明しました。
2025年12月、Anthropicは従業員を対象としたクラシファイド型マーケットプレイスの実験を1週間実施しました。参加者は全員100ドルの予算を与えられました。開始前にClaudeが各ボランティアに短いインタビューを行い、何を売りたいのか、どの価格で売りたいのかを把握しました。
その後、AIエージェントが完全に引き継ぎました。リストを作成し、潜在的な買い手と売り手を探し、提案を行い、価格交渉を進めたのです。
市場の力関係が静かに傾く
本来の研究目的は、参加者が最初は知らされていない並行実験に隠されていました。Anthropicは同時に4つのバージョンのマーケットプレイスを実行しました。2つのバージョンではすべてのエージェントがAnthropicの最先端モデル「Claude Opus 4.5」を使用していました。もう2つでは、各参加者が50パーセントの確率でより弱いモデル「Claude Haiku」に置き換えられました。
すべてのエージェントがOpusを使用した「本番」実行では、69人のエージェントが500以上のリストで186件の取引を成立させ、総額4000ドル以上を動かしました。参加者は個別取引の公正性を平均7点中4点と評価しており、中間値でした。
混合実行は測定可能な格差を露呈させました。Opusユーザーは平均でHaikuユーザーよりも約2件多くの取引を成立させました。同じ商品がOpusエージェントとHaikuエージェントで1回ずつ売却された場合、Opusは平均して3.64ドル多く獲得しました。
例えば、培養ルビーはOpusでは65ドルで売れましたが、Haikuでは35ドルでした。Opusエージェントは60ドルの値付けから始まり、競争入札によって値上げされましたが、Haikuエージェントは40ドルで開始して値下げされました。
少なくとも2つの実行で売却された161品目を通じて、Opus売り手は平均2.68ドル多く獲得し、Opus買い手は平均2.45ドル安く購入しました。OpusセラーがHaikuバイヤーと対面した場合、その平均価格差は異なります。
参加者がエージェントに与えた交渉指示はほとんど影響を与えませんでした。フレンドリーなアプローチを求める人もいれば、強気な交渉を求める人もいましたが、モデルの強さの方が指示よりも優位でした。
敗者は自分が負けていることに気づかない
明らかな効果にもかかわらず、参加者は自分たちの取引でモデルの強さが果たした役割に気づきませんでした。実験は敗者がより低い評価を与えることを期待していましたが、そうはなりませんでした。Opusエージェントと取引した参加者とHaikuエージェントと取引した参加者の間で、公正性の評価に有意差はありませんでした。
Anthropicはこれを「不快な含意」と呼んでいます。異なる強さのエージェントが実際の市場で出会うとき、人々は自分たちが負けていることを決して知らずに負け側に終わる可能性があるということです。同社は、この実験がこれらの動向を詳細に掘り下げるために構築されたものではなく、さらなる研究が必要であると述べています。
実験はまた、AIエージェント商取引が遠い将来のシナリオではないことも示唆しています。参加者の46パーセントがこのようなサービスに料金を払う意思があると述べました。
