Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加
🔒 公式発表のみ掲載。噂・リーク・情報商材は載せません。
← 用語集に戻る

従量課金

Pay-as-you-go Pricing

じゅうりょうかきん

解説

従量課金とは、利用量に応じて費用が増減する料金方式で、AIでは主にトークンや処理量が基準になります。料金見積もりの基本になります。

プロトタイプ段階では月に数百円だったAPI費用が、リリース後に数十万円に膨れ上がった――これはAI開発者の間ではよく聞く話です。従量課金(Pay-As-You-Go)とは、実際に使った分だけ料金が発生する課金モデルで、AI APIでは処理したトークン数やリクエスト数に応じて課金されます。月額固定費が発生しない柔軟な仕組みですが、適切な管理が欠かせません。

課金の仕組み

APIを呼び出すたびに、入力トークン数と出力トークン数に応じた料金が加算されます。たとえばOpenAIのGPT-4oでは入力と出力でトークン単価が異なり、出力のほうが高額です。画像生成APIでは生成枚数、音声APIでは処理秒数が課金単位になります。使わなければゼロ円、大量に使えばそれに比例した金額になるシンプルな構造です。月末(または設定した請求サイクル)に使用量の合計が請求されます。

サブスクリプションとの違い

ChatGPT Plusの月額20ドルは、一定の利用量を含む定額制のサブスクリプションです。毎日ヘビーに使う個人ユーザーには定額制がお得ですが、APIで自社サービスやアプリを構築する場合は従量課金が基本になります。利用量が安定して大きくなったら、AnthropicやOpenAIが提供するコミットメント割引(一定額の前払いによる割引)を検討するのが賢い選択です。料金ティアの仕組みと組み合わせて最適なプランを選びましょう。

予算暴走のリスクと実例

従量課金の最大のリスクは予想外の高額請求です。バグによる無限ループ、想定外のトラフィック急増、プロンプトインジェクション攻撃による大量リクエストなどが原因で、一晩で数千ドルの請求が発生した事例が開発者コミュニティで報告されています。あるスタートアップでは、デバッグ用コードの消し忘れにより週末の2日間で50万円以上の請求が来たケースもあります。

実践的なコスト管理

まず、OpenAIやAnthropicのダッシュボードで月間の予算上限とアラートを必ず設定してください。次に、小規模テストで1リクエストあたりの平均コストを計測し、想定ユーザー数から月間コストを推定します。ピーク時は平均の3〜5倍を想定してバッファを持たせましょう。プロンプトキャッシュの活用や、用途に応じたより安価なモデルへの振り分けも有効な節約手段です。実際の運用データに基づいた定期的な見直しがコスト管理の鍵になります。従量課金は柔軟性が最大の武器ですが、その柔軟性を活かすには計画的なモニタリングが不可欠です。