OpenAI03:21ポリシー公式ブログ
OpenAI、GPTモデル内のゴブリン言及増加の原因を特定・修正します
意図せぬモデル癖を防ぎ、業務で安定した出力が得られます。
ポイント
- 1Nerdyパーソナリティの報酬がゴブリン言及を175%増加させた
- 2訓練データから無関係なクリーチャー参照を除去
- 3GPT-5.5のCodexに抑制プロンプト追加
- 4モデル監査ツールを開発中
OpenAIがGPT-5.1以降のモデルでゴブリンやグレムリン言及が急増した原因をNerdyパーソナリティの報酬信号と特定しました。訓練データフィルタリングと報酬除去で修正し、将来モデルで再発防止します。開発者はCodexでゴブリン抑制プロンプトを使えます。モデル挙動の安定性が向上します。