Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加Google DeepMindシンガポールAI安全パートナーシップ拡大Anthropic、Project Glasswingで1万件超の脆弱性を発見SynthIDがGoogle SearchとChromeに拡大Anthropic、脆弱性開示ダッシュボードを更新Goal modeがCodex全プラットフォームで利用開始Codex ThursdayでMac遠隔操作機能追加Anthropic、Glasswing初期成果を公開Anthropic、Project Glasswing初期成果を公開科学向けAIスキルツールを新公開Gemini 3.5 Flashが公開、研究ツール強化GoogleがADK for Android/Kotlin 0.1.0を公開Google、ADK for Kotlin/Android 0.1.0公開Google、Gemini for Homeを開発者向けに本格展開Gemini 3.5 Flashが正式公開AIが数学の未解決問題を初めて解決Google、Gemini Omniを発表し動画生成・編集を強化Gemini Omniで複数エージェントを活用OpenAIが長期コンピュート保証サービスを導入Gemini for Scienceが研究タスクをAI支援AI生成画像にSynthID透かしと検証ツール追加
🔒 公式発表のみ掲載。噂・リーク・情報商材は載せません。
← 用語集に戻る

埋め込み

Embedding

うめこみ

解説

埋め込みとは、文章や画像を意味が近いほど近くなる数値ベクトルに変換し、検索や分類に使う表現です。理解すると調整がしやすくなります。

「猫」と「ネコ」は表記が違いますが意味は同じです。一方、「バンク」は文脈によって「銀行」にも「堤防」にもなります。埋め込み(Embedding)とは、テキストや画像を数値ベクトルに変換し、意味の近さを数学的な距離として表現する技術です。

なぜベクトルに変換するのか

コンピュータは「猫」と「犬」が似た概念であることを、文字列の比較だけでは理解できません。しかし、これらを数百次元の数値ベクトル(例: [0.23, -0.15, 0.87, ...])に変換すると、意味が近い単語はベクトル空間上で近くに、遠い単語は遠くに配置されます。この性質により、「意味の類似度」を数値として計算できるようになります。

どう作られるか

埋め込みモデルは、大量のテキストデータから「どの単語がどの文脈で一緒に使われるか」を学習します。たとえば「王」「女王」「王子」は似た文脈で登場するため、近いベクトルになります。最新の埋め込みモデル(OpenAIのtext-embedding-3、GoogleのGecko、CohereのEmbed v3など)は、単語だけでなく文章全体の意味をベクトル化でき、数千次元の精密な表現が可能です。

RAGの検索エンジンとして

埋め込みの最も重要な応用がRAG(検索拡張生成)の検索部分です。社内ドキュメントをあらかじめ埋め込みベクトルに変換してデータベース(ベクトルストア)に格納しておきます。ユーザーが質問すると、その質問もベクトルに変換し、コサイン類似度などの指標で最も近いドキュメントを検索します。キーワードの完全一致ではなく意味レベルで検索できるため、「売上の推移」と「収益のトレンド」のような表現の違いを吸収できます。

セマンティック検索と分類

RAG以外にも、埋め込みは幅広く活用されています。ECサイトの類似商品レコメンド、カスタマーサポートの類似質問検索、ニュース記事のクラスタリング、スパムメールの検出など、「似ているものを見つける」タスク全般で威力を発揮します。画像の埋め込みを使えば、テキストで画像を検索したり、類似画像を見つけることも可能です。

選び方と注意点

埋め込みモデルを選ぶ際のポイントは、対応言語、ベクトルの次元数、処理速度、コストのバランスです。次元数が大きいほど表現力は高まりますが、ストレージと検索コストも増えます。また、日本語の精度は英語に比べてモデル間の差が大きいため、日本語での検索精度を事前にテストすることが重要です。OpenAIのtext-embedding-3-smallは、コストと精度のバランスが良く、日本語にも対応しているため、最初の選択肢として広く使われています。