Structured Output

構造化出力

こうぞうかしゅつりょく

Definition

Structured output is an output style that forces responses into a predefined structure so downstream systems can process them reliably. It is important for integrating LLMs into applications and workflows.

LLMの回答を「人間が読む」だけでなく「プログラムが処理する」用途が急増しています。しかし自然言語の出力をそのままコードで扱おうとすると、フォーマットのばらつきに悩まされます。構造化出力とは、LLMの応答をJSON・XML・YAMLなどの機械可読な形式で生成させる技術で、出力を下流のプログラムが確実にパースできるようにするものです。

なぜ構造化出力が求められるのか

LLMをアプリケーションに組み込む場面では、出力を次の処理に渡す必要があります。たとえば「ユーザーのレビューから、評価（1〜5）、要約、キーワードを抽出して」という処理を行う場合、結果がプログラムで確実にパースできるJSONでないと、後続の処理が破綻します。「たいていJSON形式で返してくれるが、たまにフォーマットが崩れる」という不安定さは、本番環境では許容できません。

実現のアプローチ

構造化出力を実現する方法は大きく3つあります。プロンプトでの指示は最もシンプルで、「以下のJSON形式で出力してください」とスキーマを示す方法です。手軽ですが、モデルがスキーマに従わない場合があります。

APIレベルのスキーマ強制は、OpenAIの「Structured Outputs」機能やAnthropicのツール利用機能で実現できます。JSONスキーマを定義してAPIに渡すと、モデルの出力が必ずそのスキーマに準拠することが保証されます。出力の型安全性がAPI側で担保されるため、最も信頼性の高い方法です。

後処理での修正は、モデルの自由形式の出力から正規表現やパーサーで必要な情報を抽出する方法です。柔軟性は高いですが、実装が複雑になりがちです。

関数呼び出しとの関係

構造化出力と関数呼び出し（Function Calling）は密接に関連しています。関数呼び出しでは、モデルが「どの関数をどの引数で呼ぶか」をJSON形式で出力します。これは本質的に構造化出力の一形態です。実際、OpenAIのStructured Outputs機能は、関数呼び出しと同じ技術基盤の上に構築されています。関数呼び出しは「アクションのための構造化出力」と捉えることもできます。

設計のベストプラクティス

スキーマ設計にはいくつかのコツがあります。フィールド名は説明的にすること（`s`より`sentiment_score`）。列挙型（enum）を活用すること（自由テキストより選択肢を制限）。ネストを深くしすぎないこと（2〜3階層まで）。そしてオプショナルフィールドにはデフォルト値を用意することです。

実務での活用シーン

構造化出力は、データ抽出パイプライン、分類・タグ付けシステム、APIのレスポンス生成、フォーム入力の自動化など、LLMの出力をプログラムが消費するあらゆる場面で活用されています。AIアプリケーション開発において、構造化出力の設計は「プロンプトエンジニアリング」と同様に重要なスキルです。