モデル・技術

ファインチューニングとは?Fine-tuning・事前学習後の追加学習

読み:ふぁいんちゅーにんぐ / 英:Fine-tuning

更新日: 読了目安:約6分

ファインチューニング(Fine-tuning/FT)は、大規模に事前学習されたLLMなどを、特定のタスク・業務・文体に合わせて追加学習する手法の総称です。本記事は誤差逆伝播法の数学的詳細ではなく、「いつFTを選び、何と混同しないか」——調整手法の選択マップ——に焦点を当てます。

試験で問われる見方

定義の核はシンプルです。「事前学習済みモデルを特定用途のデータで追加学習させること」TF-0127TF-0164)。ゼロから学び直す事前学習とは区別します。

比較問題では、ChatGPTの説明をファインチューニングに当てはめる誤答が頻出です(HQ-0193)。ChatGPTはサービス、ファインチューニングは学習手法です。

G検定では、事前学習とファインチューニングの関係(G-383)、LoRAが全パラメータを必ず更新するわけではない点(TF-177)もセットで問われます。

演習で確認する

生成AIパスポート:TF-0127TF-0164TF-0128(誤解)HQ-0193(ChatGPT比較)

G検定:G-383TF-177(LoRA)

ファインチューニングとは

現代の生成AIは、まずインターネット規模のテキストなどで事前学習(Pre-training)され、言語の一般能力を獲得します。その後、社内マニュアルに合わせた応答、医療用語への適応、コード生成の強化など、目的に沿った追加学習がファインチューニングです。

全パラメータを更新するFull Fine-tuningから、LoRAのようなパラメータ効率的な手法まで、広い意味で「FT」と呼ばれることがあります。試験では、まず追加調整の概念を正しく答えられることが優先です。

いつ使うか

次のような場面で検討されます(すべてFTが最適とは限りません)。

ドメイン特化

法律・医療・社内用語など、一般モデルに足りない知識・文体を埋めたい

タスク特化

要約・分類・フォーマット出力など、同じ形式を安定して出したい

指示追従の強化

良い応答例(SFT)で、プロンプトへの従順さを高める — RLHFの前段にもなる

一方、単発の依頼や軽い体裁変更なら、まずプロンプト設計やRAGで足りることも多いです。FTはデータ準備・計算コスト・品質評価が必要です。

調整手法の比較

手法 何をするか コスト感 試験での区別
プロンプト 推論時の指示・例示 低(学習不要) 重みは変えない
RAG 外部知識を検索して渡す 中(インフラ) モデル学習そのものではない
ファインチューニング 追加学習で重みを更新 高〜中 事前学習後の調整全般
LoRA 低ランク行列だけ学習 FTより低め FTの効率版。全重み更新とは限らない
RLHF 人間の好みで最適化 FTの一種を含みうるが、同義ではない
アライメント 意図に沿わせる考え方 手法名ではなく目的

注意点

  • データ品質 — 偏った学習データは出力の偏りを増幅する
  • 汎化性能の低下 — 特化しすぎると他タスクで性能が落ちる(catastrophic forgetting)
  • プライバシー — 学習データに個人情報機密を入れない
  • 評価の必要性 — FT後もハルシネーションは残りうる

よくある質問

ファインチューニングとChatGPTは同じ?

いいえ。FTは学習手法、ChatGPTはサービスです(HQ-0193)。

ファインチューニングとLoRAは同じ?

LoRAはファインチューニングの効率的な実装の一つです。FT全般とLoRAを同一視しないでください。

ファインチューニングとRLHFは同じ?

RLHFは人間の好みを反映する調整パイプラインで、SFT(FTの一形態)を含みますが、FT全体と同義ではありません。

少量データでも効果がある?

LoRAなどでは少データでも適応しやすいとされますが、品質はデータと評価設計に依存します。試験では「追加学習で用途に合わせる」定義が中心です。