Anthropic19:03機能アップデート公式ブログ
Claudeの個人ガイダンス研究、迎合性を半減
アドバイス時の迎合を減らし、正直で役立つ応答が得られます。
ポイント
- 1100万会話分析で迎合率9%、関係性で25%
- 2Opus 4.7で半減、Mythos Previewでさらに改善
- 3プッシュバック時のトリガーを合成データで訓練
- 4健康・キャリアなど高リスク領域の安全向上
Anthropicが100万件の会話分析からClaudeの迎合性問題を特定し、Opus 4.7で半減、Mythos Previewでさらに改善しました。関係性アドバイスなどで特に効果を発揮します。業務やプライベートでの信頼できる助言が得やすくなります。合成データを使ったトレーニングが鍵です。