ベクトルデータベース(Vector Database/ベクトルDB)は、埋め込みベクトルと元テキストなどのメタデータを保存し、意味的に近いベクトルを高速検索するためのデータベースです。本記事は製品比較ではなく、RAGスタックの基盤層——チャンク・RAGと混同しない定義——に焦点を当てます。
試験で問われる見方
定義の核:「意味的な近さで検索できるよう、埋め込みベクトルを保存・検索するデータベース」(HQ-0449、HQ-0416、HQ-0471)。
○:埋め込みを保存し意味検索に使う(TF-0232)。×:個人識別番号だけを保管する行政台帳(TF-0233)。
チャンクの定義やRAGの定義をベクトルDBにすり替える誤答が多いです(HQ-0448のB選択肢など)。
ベクトルDBとは
従来のRDBは行・列の完全一致検索が得意です。ベクトルDBは、高次元ベクトル間の近傍探索(ANN: Approximate Nearest Neighbor)に最適化されています。数百万チャンク規模でもミリ秒〜秒オーダーで類似検索できる製品があります。
代表例として Pinecone、Weaviate、Milvus、pgvector(PostgreSQL拡張)などが知られますが、試験では役割の定義が優先です。
近い用語との違い
| 用語 | 一言 |
|---|---|
| ベクトルDB | ベクトル保存+類似検索のストア |
| ベクトル検索 | 検索の方式・処理 |
| チャンク | 分割された文書片 |
| RAG | 検索+生成の全体手法 |
RAGでの役割
運用・リスク
よくある質問
ベクトルDB=RAG?
いいえ。RAGの構成要素のひとつです。
通常のDBで代用できる?
小規模なら可能ですが、大規模な意味検索では専用DBや拡張の利用が一般的です。
行政のマイナンバー台帳?
いいえ(TF-0233)。AI文脈の技術用語です。