Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加
🔒 公式発表のみ掲載。噂・リーク・情報商材は載せません。
← 用語集に戻る

リランキング

Re-ranking

りらんきんぐ

解説

リランキングとは、検索で集めた候補文書を別モデルや評価関数で並べ替え、より関連度の高い順に絞り込む工程です。理解すると調整がしやすくなります。

ベクトル検索で上位20件の文書を取得しても、本当に質問に関連するのは数件だけ、ということがよくあります。最初の検索は「広く網を投げる」段階であり、そこから精度を高める仕上げが必要です。リランキング(Re-ranking)とは、検索で取得した文書をより精密なモデルで再評価し、関連度の高い順に並べ替える手法です。

なぜリランキングが必要なのか

最初の検索段階(ファーストステージ)で使われるベクトル検索やBM25は、高速に大量の候補を絞り込むことに最適化されています。しかし、クエリと文書を個別にベクトル化するバイエンコーダー方式では、両者の細かなニュアンスの対応関係を捉えきれません。たとえば「Pythonでのエラーハンドリング」という質問に対して、Pythonの一般的な概要記事が上位に来てしまうことがあります。

クロスエンコーダーの仕組み

リランキングではクロスエンコーダーと呼ばれるモデルが使われます。バイエンコーダーがクエリと文書を別々にベクトル化するのに対し、クロスエンコーダーはクエリと文書を1つのペアとして同時に入力し、関連度スコアを直接出力します。両者の単語レベルの対応関係を細かく分析できるため、精度はバイエンコーダーを大きく上回ります。Cohere Rerank、Jina Reranker、BGE Rerankなどが代表的なモデルです。

パイプラインでの位置づけ

リランキングはRAGパイプラインの中で「セカンドステージ」に位置づけられます。一般的な流れは、まず検索で候補を50〜100件取得し、リランカーで再評価して上位5〜10件に絞り、それをLLMのコンテキストとして渡します。この2段階のアプローチにより、検索の速度と精度を両立できます。

コストとレイテンシのトレードオフ

クロスエンコーダーは精度が高い反面、各候補をクエリとペアで処理するため、候補数に比例して推論コストとレイテンシが増加します。100件の候補をリランキングすれば100回の推論が必要です。そのため、ファーストステージで候補数をある程度絞っておくことが重要です。また、API型のリランカー(Cohere Rerankなど)は1リクエストあたりの課金となるため、検索頻度が高いシステムではコスト設計も考慮が必要です。リランキングは精度への貢献が大きいため、RAGの品質改善で最初に検討すべき手法の1つです。