ChatGPTの「オタク」人格設定における学習過程で、ゴブリンなどの生き物の比喩が過度に評価されたため、回答内での使用が急増していた。OpenAIは該当機能の廃止とフィルタリング導入により、この異常現象への対策を完了した。
ChatGPTの回答に「ゴブリン」の比喩が異常に増殖する現象が発生していた。米OpenAIがこの珍事件のメカニズムを突き止めたところ、人格カスタマイズ機能の学習過程でモンスターの名前の出力が過度に高く評価されたことが原因だったという。
この問題の発端は、ChatGPTの人格設定の一つ「Nerdy」(オタク)だった。ユーザーは好みの返答スタイルを複数の人格から選択できる機能で、オタク人格は知的で遊び心のある文体を促す設定だ。全回答に占めるオタク的表現の比率はわずか2.5%であったにもかかわらず、ゴブリンを含む表現の66.7%がオタク的表現に集中していたという。
OpenAIが強化学習中の出力を調査した結果、ゴブリンや「グレムリン」を含む回答が、オタク人格の学習において高く評価される傾向を示していた。このことが連鎖的な問題を引き起こし、「GPT-5.1」では「GPT-5」と比較してChatGPTの回答に含まれるゴブリンの使用が175%、グレムリンが52%増加していた。その後もこの高い評価が学習プロセスに影響を与え続け、「GPT-5.4」や「GPT-5.5」の回答でもゴブリンやグレムリンの使用がさらに増加していったのである。
OpenAIは3月にオタク人格を廃止し、学習時に生き物の比喩を好む設定を削除した。さらに生き物を表す単語を含む訓練データもフィルタリングする対策を実施した。
ただし、GPT-5.5は原因特定前に学習が進行していたため、「Codex」でのテスト段階でも同様の傾向が確認された。OpenAIはこれに対応するため、Codex向けに開発者プロンプト内に、明確に関連がある場合を除いてゴブリンなどの生き物の比喩を使用しないよう抑制する指示を追加した。
