LoRAとは？低ランク適応・効率的ファインチューニング

LoRA（Low-Rank Adaptation／低ランク適応）は、巨大なLLMを少ない追加パラメータで用途に合わせて調整するファインチューニング技法です。本記事はプロンプト設計の話ではなく、モデル重みをどう更新するか——全パラメータ更新とのコスト比較——に焦点を当てます。

試験で問われる見方

G検定では、「LoRAは全パラメータを必ず完全更新する」は×です。低ランク行列を追加して学習する効率的な適応手法であり、計算量・保存容量を抑えやすい点が特徴です（TF-177）。

ファインチューニング全般として、事前学習済みモデルを特定用途に追加調整する方法である、という定義も押さえておきます（TF-0164、TF-0127）。

演習で確認する

G検定：TF-177（LoRAの定義）、G-383（事前学習とファインチューニング）

LoRAは、大規模な事前学習済みモデルの元の重みを固定したまま、層に小さな低ランク行列を足し込み、その追加部分だけを学習する手法です。Full Fine-tuning（全パラメータ更新）より、GPUメモリや学習時間を大幅に抑えられることが多いです。

PEFT（Parameter-Efficient Fine-Tuning／パラメータ効率的ファインチューニング）の代表的な一つとして、オープンソースのLLMを社内データに合わせて調整する場面で広く使われています。

試験レベルでは、次のイメージで十分です。

「低ランク」とは、行列の情報を圧縮した近似で更新を表す、という理解で試験には足ります。数学の詳細はG検定の範囲外であることが多いです。

手法	更新対象	コスト感	試験での注意
プロンプトのみ	モデル重みは変更しない	最も低い	ファインチューニングではない
LoRA	低ランクの追加パラメータ	中程度（FTより軽い）	全パラメータ更新ではない
QLoRA	量子化基底＋LoRA追加部分	LoRAよりVRAMをさらに抑えやすい	LoRA＋量子化の組み合わせ
Full Fine-tuning	モデルの重み全体	高い	データ・計算が大量に必要
アライメント（RLHF等）	振る舞い・価値観の調整	目的が異なる	社内ドメイン適応とは別文脈も

一方、RAGで外部知識を渡せる場合は、ファインチューニングなしで要件を満たすこともあります。LoRAは万能ではなく、データ量・更新頻度・コストで選びます。

LoRAは効率的ですが、学習データの品質・権利・偏りの問題は残ります。また、ベースモデルの能力を超える知識を「学習し足す」わけではなく、振る舞いや表現の適応が中心です。

機密データで学習する場合は、個人情報や社内規程の確認が別途必要です。技法の話とコンプライアンスは切り分けて考えてください。

LoRAは全パラメータを更新する？

いいえ。追加の低ランクパラメータを学習する手法です（TF-177）。

LoRAとファインチューニングは同じ？

LoRAはファインチューニングの一手法です。ファインチューニングには全パラメータ更新など別方式もあります。

LoRAとRLHFの違いは？

LoRAは主にドメイン適応などの重み調整、RLHFは人間フィードバックによる振る舞い調整の手法です。アライメントの記事も参照。

生成AIパスポートでも出る？

LoRA単独の問題は少ないですが、ファインチューニングの定義（第2章）は頻出です。本記事と第2章一問一答を併用してください。