Source Attribution (Citations)
出典引用
しゅってんいんよう
Definition
Source attribution is a mechanism that explicitly shows the documents or passages used as evidence so readers can verify the answer. It is important for trust, auditing, and safer RAG experiences.
AIが「当社の育児休業は最大2年間取得可能です」と回答したとき、それが就業規則の何ページに書かれているのかがわからなければ、人事担当者はその回答を安心して使えません。出典引用(Source Attribution)とは、AIの回答に情報源の参照を付与し、ユーザーが根拠を確認できるようにする仕組みです。
なぜ出典が重要なのか
LLMの回答は常に正しいとは限りません。ハルシネーションのリスクがある以上、ユーザーが自分の目で正確性を確認できることが不可欠です。出典引用があれば、回答が信頼に足るかを判断でき、詳細を知りたい場合は原典にあたることもできます。「AIが言ったから正しい」ではなく「この情報源に基づいているから確認できる」という構造が、ビジネスでのAI活用の信頼基盤になります。
RAGにおける引用の実装
RAGシステムでの出典引用は、検索で取得したチャンクのメタデータ(ファイル名、ページ番号、URL、更新日など)を回答と紐づけることで実現します。プロンプトに「回答の各ポイントについて、参照した文書を[1][2]のように番号で引用してください」と指示し、回答末尾に参考文献リストを付与する方法が一般的です。Perplexityのようなサービスでは、回答文中にインライン引用を表示して情報源の透明性を確保しています。
引用精度の課題
しかし、LLMに引用を指示しても必ず正確な引用になるとは限りません。実際には参照していない文書を引用したり、引用番号と内容が対応しなかったりするケースがあります。これを改善するために、回答生成後に引用の正確性を検証するポストプロセスや、チャンクごとに回答を生成してから統合する方法が研究されています。
信頼構築のデザイン
出典引用は技術的な問題だけでなく、UIデザインの問題でもあります。引用元へのリンクをクリック可能にする、引用箇所をハイライト表示する、情報源の鮮度(最終更新日)を表示するなど、ユーザーが直感的に根拠を確認できるインターフェースが重要です。また、「この回答は以下の3件の社内文書に基づいています」のように、参照した文書の数と範囲を明示することで、回答の網羅性についてもユーザーが判断できるようになります。出典引用の質は、AIシステムに対する組織全体の信頼度を左右する重要な要素です。