ベクトルDBは行政の個人番号台帳？

いいえ。埋め込みベクトルの保存と類似検索のためのデータベースであり、個人識別番号台帳ではない。

ベクトルデータベースとは？Vector Database・RAGの基盤

ベクトルデータベース（Vector Database／ベクトルDB）は、埋め込みベクトルと元テキストなどのメタデータを保存し、意味的に近いベクトルを高速検索するためのデータベースです。本記事は製品比較ではなく、RAGスタックの基盤層——チャンク・RAGと混同しない定義——に焦点を当てます。

試験で問われる見方

定義の核：「意味的な近さで検索できるよう、埋め込みベクトルを保存・検索するデータベース」（HQ-0449、HQ-0416、HQ-0471）。

○：埋め込みを保存し意味検索に使う（TF-0232）。×：個人識別番号だけを保管する行政台帳（TF-0233）。

チャンクの定義やRAGの定義をベクトルDBにすり替える誤答が多いです（HQ-0448のB選択肢など）。

演習で確認する

TF-0232、TF-0233、HQ-0449

ベクトルDBとは

従来のRDBは行・列の完全一致検索が得意です。ベクトルDBは、高次元ベクトル間の近傍探索（ANN: Approximate Nearest Neighbor）に最適化されています。数百万チャンク規模でもミリ秒〜秒オーダーで類似検索できる製品があります。

代表例として Pinecone、Weaviate、Milvus、pgvector（PostgreSQL拡張）などが知られますが、試験では役割の定義が優先です。

近い用語との違い

用語	一言
ベクトルDB	ベクトル保存＋類似検索のストア
ベクトル検索	検索の方式・処理
チャンク	分割された文書片
RAG	検索＋生成の全体手法

RAGでの役割

チャンキングした文書を埋め込みモデルでベクトル化
ベクトル＋本文＋メタデータをベクトルDBに登録
質問ベクトルで近傍検索 → 関連チャンクを取得
LLMがチャンクを参照して回答（RAG）

運用・リスク

個人情報・機密をインデックスしない／マスキング
文書更新時の再インデックス手順
アクセス制御・テナント分離（マルチテナントSaaS）
検索精度はDBだけでは決まらない（埋め込み・チャンク設計）

すり替えに注意

誤った説明	正しい理解
ベクトルDB＝RAG	ストア vs 検索＋生成の全体手法
ベクトルDB＝チャンク	ベクトル保存基盤 vs 文書の分割片（HQ-0448）
個人番号の行政台帳	埋め込みベクトルの意味検索用DB（TF-0233は×）
ベクトルDBがあれば検索精度100%	埋め込み・チャンク設計にも依存

よくある質問

ベクトルDB＝RAG？

いいえ。RAGの構成要素のひとつです。

通常のDBで代用できる？

小規模なら可能ですが、大規模な意味検索では専用DBや拡張の利用が一般的です。

行政のマイナンバー台帳？

いいえ（TF-0233）。AI文脈の技術用語です。