ファインチューニングとは？Fine-tuning・事前学習後の追加学習

ファインチューニング（Fine-tuning／FT）は、大規模に事前学習されたLLMなどを、特定のタスク・業務・文体に合わせて追加学習する手法の総称です。本記事は誤差逆伝播法の数学的詳細ではなく、「いつFTを選び、何と混同しないか」——調整手法の選択マップ——に焦点を当てます。

試験で問われる見方

定義の核はシンプルです。「事前学習済みモデルを特定用途のデータで追加学習させること」（TF-0127、TF-0164）。ゼロから学び直す事前学習とは区別します。

比較問題では、ChatGPTの説明をファインチューニングに当てはめる誤答が頻出です（HQ-0193）。ChatGPTはサービス、ファインチューニングは学習手法です。

G検定では、事前学習とファインチューニングの関係（G-383）、LoRAが全パラメータを必ず更新するわけではない点（TF-177）もセットで問われます。

演習で確認する

生成AIパスポート：TF-0127、TF-0164、TF-0128（誤解）、HQ-0193（ChatGPT比較）

G検定：G-383、TF-177（LoRA）

ファインチューニングとは

現代の生成AIは、まずインターネット規模のテキストなどで事前学習（Pre-training）され、言語の一般能力を獲得します。その後、社内マニュアルに合わせた応答、医療用語への適応、コード生成の強化など、目的に沿った追加学習がファインチューニングです。

全パラメータを更新するFull Fine-tuningから、LoRAのようなパラメータ効率的な手法まで、広い意味で「FT」と呼ばれることがあります。試験では、まず追加調整の概念を正しく答えられることが優先です。

いつ使うか

次のような場面で検討されます（すべてFTが最適とは限りません）。

ドメイン特化

法律・医療・社内用語など、一般モデルに足りない知識・文体を埋めたい

タスク特化

要約・分類・フォーマット出力など、同じ形式を安定して出したい

指示追従の強化

良い応答例（SFT）で、プロンプトへの従順さを高める — RLHFの前段にもなる

一方、単発の依頼や軽い体裁変更なら、まずプロンプト設計やRAGで足りることも多いです。FTはデータ準備・計算コスト・品質評価が必要です。

調整手法の比較

手法	何をするか	コスト感	試験での区別
プロンプト	推論時の指示・例示	低（学習不要）	重みは変えない
RAG	外部知識を検索して渡す	中（インフラ）	モデル学習そのものではない
ファインチューニング	追加学習で重みを更新	高〜中	事前学習後の調整全般
LoRA	低ランク行列だけ学習	FTより低め	FTの効率版。全重み更新とは限らない
RLHF	人間の好みで最適化	高	FTの一種を含みうるが、同義ではない
アライメント	意図に沿わせる考え方	—	手法名ではなく目的

注意点

データ品質 — 偏った学習データは出力の偏りを増幅する
汎化性能の低下 — 特化しすぎると他タスクで性能が落ちる（catastrophic forgetting）
プライバシー — 学習データに個人情報や機密を入れない
評価の必要性 — FT後もハルシネーションは残りうる

すり替えに注意

誤った説明	正しい理解
FT＝ChatGPT	学習手法 vs サービス（HQ-0193）
FT＝事前学習	追加学習 vs ゼロからの学習（TF-0127）
FT＝RAG	重み更新 vs 検索で知識を渡す
LoRA＝全パラメータ更新	効率的な一部更新（TF-177）

よくある質問

ファインチューニングとChatGPTは同じ？

いいえ。FTは学習手法、ChatGPTはサービスです（HQ-0193）。

ファインチューニングとLoRAは同じ？

LoRAはファインチューニングの効率的な実装の一つです。FT全般とLoRAを同一視しないでください。

ファインチューニングとRLHFは同じ？

RLHFは人間の好みを反映する調整パイプラインで、SFT（FTの一形態）を含みますが、FT全体と同義ではありません。

少量データでも効果がある？

LoRAなどでは少データでも適応しやすいとされますが、品質はデータと評価設計に依存します。試験では「追加学習で用途に合わせる」定義が中心です。