CodexがWindows PCを直接操作可能にOpenAIがRosalind Biodefenseを発表Anthropic、Series Hで650億ドル調達AnthropicがSeries Hで650億ドル調達Claude Opus 4.8が本日全プラットフォームで利用開始Claude Opus 4.8がウェブとAPIで利用可能にAnthropicがClaude Opus 4.8にFast modeを追加AnthropicがClaude Opus 4.8を公開し、作業の切り替えも改善AnthropicがSeries Hで650億ドルを調達AnthropicがClaude Opus 4.8を公開、作業速度も改善OpenAIがGPT-5.5 Instantを読みやすく改良Claude Codeに動的ワークフローを研究プレビュー追加Gemini Omniで会話編集が可能にOpenAIが2026年選挙向け対策を公開、誤情報対策を強化SynthID水印をOpenAIなどと連携拡大Anthropic、Responsible Scaling Policyを更新(v3.2)OpenAIがChatGPTの広告ポリシーを更新し基準を追加AnthropicがClaudeの「封じ込め」設計を公開Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見CodexがWindows PCを直接操作可能にOpenAIがRosalind Biodefenseを発表Anthropic、Series Hで650億ドル調達AnthropicがSeries Hで650億ドル調達Claude Opus 4.8が本日全プラットフォームで利用開始Claude Opus 4.8がウェブとAPIで利用可能にAnthropicがClaude Opus 4.8にFast modeを追加AnthropicがClaude Opus 4.8を公開し、作業の切り替えも改善AnthropicがSeries Hで650億ドルを調達AnthropicがClaude Opus 4.8を公開、作業速度も改善OpenAIがGPT-5.5 Instantを読みやすく改良Claude Codeに動的ワークフローを研究プレビュー追加Gemini Omniで会話編集が可能にOpenAIが2026年選挙向け対策を公開、誤情報対策を強化SynthID水印をOpenAIなどと連携拡大Anthropic、Responsible Scaling Policyを更新(v3.2)OpenAIがChatGPTの広告ポリシーを更新し基準を追加AnthropicがClaudeの「封じ込め」設計を公開Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見
公式発表のみ掲載。噂・リーク・情報商材は除外します。
← 用語集に戻る

テスト時コンピュート

Test-time Compute

てすとたいむこんぴゅーと

解説

テスト時コンピュートとは、学習後の推論時に使う計算量を増やして回答品質を高める考え方です。推論モデルやエージェントの性能改善を読む際の基礎概念です。

AIモデルの性能向上は、これまで主に学習データ、パラメータ数、学習計算量の拡大で語られてきました。しかし近年は、学習後の推論時にどれだけ計算を使うかも重要になっています。テスト時コンピュートとは、モデルが回答を生成する段階で追加の計算を使い、品質や正確性を高める考え方です。

学習時コンピュートとの違い

学習時コンピュートは、モデルを作る段階で使う計算量です。一方、テスト時コンピュートは、ユーザーの質問に答えるたびに使う計算量です。複数の解法を試す、回答候補を比較する、外部ツールで検証する、長く考えるといった方法が含まれます。モデルを再学習しなくても、推論プロセスを工夫することで性能を上げられる点が特徴です。

ニュースで見るポイント

推論モデルやエージェントの発表では、テスト時コンピュートが性能改善の背景にあることがあります。重要なのは、品質向上と引き換えに遅延やコストがどれだけ増えるかです。高難度タスクでは有効でも、単純な要約や翻訳では過剰な計算になる場合があります。

代表的な使われ方

数学問題で複数の解答を生成して一致を取る、コードを生成してテストを回す、検索で追加情報を集める、計画を作ってから実行する、といった用途があります。エージェントでは、行動前の検討や実行後の検証に計算を使うことで失敗を減らします。

注意点

テスト時コンピュートを増やせば必ず良くなるわけではありません。間違った前提を長く考え続けることもありますし、コストに見合わない改善しか得られない場合もあります。AIニュースでは、単なる「高性能化」ではなく、どの場面で追加計算が効いているのかを読むことが大切です。