Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加
🔒 公式発表のみ掲載。噂・リーク・情報商材は載せません。
← 用語集に戻る

ベクトルデータベース

Vector Database

べくとるでえたべえす

解説

ベクトルデータベースとは、埋め込みベクトルを保存し、近いベクトルを高速に検索できるよう最適化したデータ基盤です。実装設計でよく登場します。

数百万件の文書をベクトル化してRAGシステムに組み込むとき、通常のデータベースでは対応しきれません。全ベクトルとの距離を総当たりで計算していては、応答に何秒もかかってしまいます。ベクトルデータベースとは、高次元の埋め込みベクトルを効率的に格納・検索するために設計された専用のデータストアです。

なぜ専用のデータベースが必要なのか

SQLデータベースは行と列の構造化データを扱うために最適化されていますが、数百〜数千次元のベクトル間で「最も近いもの」を高速に見つける処理には向いていません。ベクトルデータベースは近似最近傍探索(ANN: Approximate Nearest Neighbor)というアルゴリズムを使い、多少の精度を犠牲にしながらも数ミリ秒で類似ベクトルを返します。代表的なANNアルゴリズムにはHNSW(Hierarchical Navigable Small World)やIVF(Inverted File Index)があります。

主要なベクトルデータベース

現在、多くのベクトルデータベースが利用可能です。Pineconeはフルマネージド型のクラウドサービスで、インフラ管理なしですぐに使い始められます。Weaviateはオープンソースで、ベクトル検索とキーワード検索のハイブリッド機能が充実しています。QdrantはRust製で高速処理に強みがあります。また、PostgreSQLにベクトル検索機能を追加するpgvectorは、既存のRDBインフラをそのまま活用できるため、導入障壁が低いと人気です。

RAGにおける役割

RAGシステムでは、ベクトルデータベースが検索のバックボーンを担います。事前に文書をチャンク分割してベクトル化し、メタデータ(ファイル名、作成日、カテゴリなど)と共にインデックスに格納します。クエリが来ると、クエリベクトルに最も近いチャンクを高速に取得し、LLMに渡します。メタデータによるフィルタリングを組み合わせれば、「2024年以降の技術文書から検索」といった条件付き検索も可能です。

選定のポイント

選定の際には、データ規模、レイテンシ要件、運用コスト、既存インフラとの相性を総合的に判断します。数千件程度なら pgvector で十分な場合も多く、数百万件を超える規模ではPineconeやQdrantのような専用ソリューションが適しています。クラウドベンダー各社もAmazon OpenSearch、Google Vertex AI Vector Search、Azure AI Searchなどのマネージドサービスを展開しており、自社のクラウド環境に合わせて選べる選択肢が広がっています。