Google15:51料金・プラン公式ドキュメント
Gemini APIにFlex/Priority推論ティア追加、コスト50%削減可能
Flexでコスト半減し、バックグラウンド処理が経済的に。
ポイント
- 1Flex: 遅延OKで50%安。
- 2Priority: 標準フォールバック自動。
- 3service_tierパラメータで切り替え。
- 4GenerateContent/Interactions対応。
GoogleがGemini APIにFlex(遅延耐性で50%安)とPriority(信頼性優先)ティアを追加。一行変更でコスト/信頼性/遅延制御。GenerateContent/Interactions API対応。バックグラウンドタスクや本番ワークロードの最適化に有効です。