ファインチューニング(Fine-tuning/FT)は、大規模に事前学習されたLLMなどを、特定のタスク・業務・文体に合わせて追加学習する手法の総称です。本記事は誤差逆伝播法の数学的詳細ではなく、「いつFTを選び、何と混同しないか」——調整手法の選択マップ——に焦点を当てます。
試験で問われる見方
定義の核はシンプルです。「事前学習済みモデルを特定用途のデータで追加学習させること」(TF-0127、TF-0164)。ゼロから学び直す事前学習とは区別します。
比較問題では、ChatGPTの説明をファインチューニングに当てはめる誤答が頻出です(HQ-0193)。ChatGPTはサービス、ファインチューニングは学習手法です。
G検定では、事前学習とファインチューニングの関係(G-383)、LoRAが全パラメータを必ず更新するわけではない点(TF-177)もセットで問われます。
ファインチューニングとは
現代の生成AIは、まずインターネット規模のテキストなどで事前学習(Pre-training)され、言語の一般能力を獲得します。その後、社内マニュアルに合わせた応答、医療用語への適応、コード生成の強化など、目的に沿った追加学習がファインチューニングです。
全パラメータを更新するFull Fine-tuningから、LoRAのようなパラメータ効率的な手法まで、広い意味で「FT」と呼ばれることがあります。試験では、まず追加調整の概念を正しく答えられることが優先です。
いつ使うか
次のような場面で検討されます(すべてFTが最適とは限りません)。
ドメイン特化
法律・医療・社内用語など、一般モデルに足りない知識・文体を埋めたい
タスク特化
要約・分類・フォーマット出力など、同じ形式を安定して出したい
指示追従の強化
良い応答例(SFT)で、プロンプトへの従順さを高める — RLHFの前段にもなる
一方、単発の依頼や軽い体裁変更なら、まずプロンプト設計やRAGで足りることも多いです。FTはデータ準備・計算コスト・品質評価が必要です。
調整手法の比較
| 手法 | 何をするか | コスト感 | 試験での区別 |
|---|---|---|---|
| プロンプト | 推論時の指示・例示 | 低(学習不要) | 重みは変えない |
| RAG | 外部知識を検索して渡す | 中(インフラ) | モデル学習そのものではない |
| ファインチューニング | 追加学習で重みを更新 | 高〜中 | 事前学習後の調整全般 |
| LoRA | 低ランク行列だけ学習 | FTより低め | FTの効率版。全重み更新とは限らない |
| RLHF | 人間の好みで最適化 | 高 | FTの一種を含みうるが、同義ではない |
| アライメント | 意図に沿わせる考え方 | — | 手法名ではなく目的 |
注意点
よくある質問
ファインチューニングとChatGPTは同じ?
いいえ。FTは学習手法、ChatGPTはサービスです(HQ-0193)。
ファインチューニングとLoRAは同じ?
LoRAはファインチューニングの効率的な実装の一つです。FT全般とLoRAを同一視しないでください。
ファインチューニングとRLHFは同じ?
RLHFは人間の好みを反映する調整パイプラインで、SFT(FTの一形態)を含みますが、FT全体と同義ではありません。
少量データでも効果がある?
LoRAなどでは少データでも適応しやすいとされますが、品質はデータと評価設計に依存します。試験では「追加学習で用途に合わせる」定義が中心です。