CodexがWindows PCを直接操作可能にOpenAIがRosalind Biodefenseを発表Anthropic、Series Hで650億ドル調達AnthropicがSeries Hで650億ドル調達Claude Opus 4.8が本日全プラットフォームで利用開始Claude Opus 4.8がウェブとAPIで利用可能にAnthropicがClaude Opus 4.8にFast modeを追加AnthropicがClaude Opus 4.8を公開し、作業の切り替えも改善AnthropicがSeries Hで650億ドルを調達AnthropicがClaude Opus 4.8を公開、作業速度も改善OpenAIがGPT-5.5 Instantを読みやすく改良Claude Codeに動的ワークフローを研究プレビュー追加Gemini Omniで会話編集が可能にOpenAIが2026年選挙向け対策を公開、誤情報対策を強化SynthID水印をOpenAIなどと連携拡大Anthropic、Responsible Scaling Policyを更新(v3.2)OpenAIがChatGPTの広告ポリシーを更新し基準を追加AnthropicがClaudeの「封じ込め」設計を公開Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見CodexがWindows PCを直接操作可能にOpenAIがRosalind Biodefenseを発表Anthropic、Series Hで650億ドル調達AnthropicがSeries Hで650億ドル調達Claude Opus 4.8が本日全プラットフォームで利用開始Claude Opus 4.8がウェブとAPIで利用可能にAnthropicがClaude Opus 4.8にFast modeを追加AnthropicがClaude Opus 4.8を公開し、作業の切り替えも改善AnthropicがSeries Hで650億ドルを調達AnthropicがClaude Opus 4.8を公開、作業速度も改善OpenAIがGPT-5.5 Instantを読みやすく改良Claude Codeに動的ワークフローを研究プレビュー追加Gemini Omniで会話編集が可能にOpenAIが2026年選挙向け対策を公開、誤情報対策を強化SynthID水印をOpenAIなどと連携拡大Anthropic、Responsible Scaling Policyを更新(v3.2)OpenAIがChatGPTの広告ポリシーを更新し基準を追加AnthropicがClaudeの「封じ込め」設計を公開Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見
公式発表のみ掲載。噂・リーク・情報商材は除外します。
← 用語集に戻る

プロンプトキャッシング

Prompt Caching

ぷろんぷときゃっしんぐ

解説

プロンプトキャッシングとは、繰り返し使う長い入力を再利用して、LLM APIの処理時間やコストを抑える仕組みです。長文RAGやエージェント実行の効率化で重要です。

LLMアプリでは、毎回同じ長いシステムプロンプト、仕様書、社内文書、ツール定義を送ることがあります。内容が同じなのに毎回最初から処理すると、遅延とコストが増えます。プロンプトキャッシングとは、繰り返し使う入力部分を再利用し、LLM APIの応答速度や費用を改善する仕組みです。

なぜ重要なのか

RAGやエージェントでは、入力が長くなりがちです。たとえば数万トークンのドキュメントを背景情報として渡し、その上で複数回質問する場合、共通部分をキャッシュできると効率が大きく変わります。モデルの賢さそのものを変える技術ではありませんが、長いコンテキストを実用的に使うための運用技術として重要です。

ニュースで見るポイント

プロンプトキャッシングの発表では、どの単位でキャッシュされるのか、どのくらい保持されるのか、料金や遅延にどう効くのか、ストリーミングやツール利用と併用できるのかを確認します。数値は変わりやすいため、特定価格よりも「長い共通入力を何度も使うワークロードに効く」と理解すると安定します。

代表的な使われ方

長いシステムプロンプトを持つチャットボット、規約や仕様書を読むRAG、同じコードベースを何度も参照するコーディングエージェント、ツール定義が多い業務エージェントで効果が出やすいです。ユーザーごとに共通の背景情報がある場合にも使われます。

注意点

キャッシュは万能ではありません。入力が毎回大きく変わる用途では効果が小さく、機密情報の扱い、キャッシュの有効期限、更新時の反映漏れにも注意が必要です。AIニュースでは「安くなる」だけでなく、どのタイプのアプリで効果が出るのかを読むことが大切です。