AI要約OpenAIポリシー03:21
AIが複数ソースを照合して要約
OpenAI、GPTモデル内のゴブリン言及増加の原因を特定・修正します
意図せぬモデル癖を防ぎ、業務で安定した出力が得られます。
参照確認
参照ソース 3件
参照ソース
要点整理
- 1Nerdyパーソナリティの報酬がゴブリン言及を175%増加させた
- 2訓練データから無関係なクリーチャー参照を除去
- 3GPT-5.5のCodexに抑制プロンプト追加
- 4モデル監査ツールを開発中
OpenAIがGPT-5.1以降のモデルでゴブリンやグレムリン言及が急増した原因をNerdyパーソナリティの報酬信号と特定しました。訓練データフィルタリングと報酬除去で修正し、将来モデルで再発防止します。開発者はCodexでゴブリン抑制プロンプトを使えます。モデル挙動の安定性が向上します。
要点
OpenAIがGPT-5.1以降のモデルでゴブリンやグレムリン言及が急増した原因をNerdyパーソナリティの報酬信号と特定しました。訓練データフィルタリングと報酬除去で修正し、将来モデルで再発防止します。開発者はCodexでゴブリン抑制プロンプトを使えます。モデル挙動の安定性が向上します。
影響
意図せぬモデル癖を防ぎ、業務で安定した出力が得られます。 確認ポイントは、Nerdyパーソナリティの報酬がゴブリン言及を175%増加させた / 訓練データから無関係なクリーチャー参照を除去 / GPT-5.5のCodexに抑制プロンプト追加です。