OpenAIガイド・活用法公式ドキュメント
OpenAI、Prompt Cachingのコツを公式ガイドで整理
同じ指示を何度も使う業務で、待ち時間とAPI費用をまとめて下げやすくなります。
ポイント
- 1キャッシュは「先頭の完全一致」が前提
- 2静的情報は前、可変情報は後ろに寄せる
- 3prompt_cache_keyでヒット率を調整可能
OpenAIはPrompt Caching(同じ先頭文を再利用して高速化・割引する仕組み)のガイドで、静的な指示や例は先頭、変わる情報は末尾に置く設計を推奨しています。キャッシュは「先頭の一致」が重要で、並び順が効果を左右します。繰り返し処理が多いアプリほど、レスポンス改善と費用削減につながります。