用語解説

ファインチューニングとは?G検定での出題傾向と覚え方

定義 · RAGとの違い · LoRA · 出題ポイント

ノートPCでファインチューニングの概念を学習する様子
出典:Unsplash(Christina @ wocintechchat.com)
更新日: 読了目安:約8分

ファインチューニング(Fine-tuning/FT)は、大規模に事前学習されたLLMなどを、特定のタスク・業務・文体に合わせて追加学習する手法です。G検定・生成AIパスポートの両方で出題され、RAGやプロンプトエンジニアリングとの使い分けが頻出テーマです。本記事では定義・種類・他手法との比較・試験の出題ポイントを整理します。詳細は用語辞典「ファインチューニング」もあわせてご覧ください。

ファインチューニングとは

ファインチューニングは、ゼロからモデルを学習するのではなく、事前学習済みモデルのパラメータ(重み)を追加学習で調整する手法です。

  • 英語表記 Fine-tuning(略称:FT)
  • 転移学習との関係 大規模データで獲得した汎用知識を、特定タスクに「転移」する考え方
  • 事前学習との対比 事前学習(Pre-training)で汎用能力を獲得→ファインチューニングで特化
  • 対象モデル 主にLLMだが、画像モデルなどにも適用される

学習の流れ

  1. 事前学習済みモデルを用意 GPT、LLaMAなど、大規模データで学習済みのベースモデル
  2. タスク用データを準備 特定ドメインのQA、社内文書、対話ログなど
  3. 追加学習を実行 ベースモデルの重みを更新し、タスクに特化
  4. 評価・デプロイ 精度を確認し、本番環境に展開

種類と関連手法

  • フルファインチューニング モデルの全パラメータを更新。高精度だがコスト・データ量が大きい
  • LoRA(Low-Rank Adaptation) 低ランク行列のみを更新する効率的なFT手法。パラメータ数を抑えられる
  • RLHF 人間のフィードバックで報酬モデルを学習し、モデルの出力を調整。ChatGPTの調整にも使われる
  • インストラクションチューニング 指示に従う形式のデータで学習し、対話能力を向上

他手法との比較

試験で最も頻出する比較です。

手法 仕組み 向いている用途
プロンプトエンジニアリング 指示文を工夫して出力を制御 手軽に試したい、汎用的なタスク
RAG 外部データを検索して参照 最新情報・社内文書の参照
ファインチューニング モデルの重みを追加学習で更新 特定ドメインの文体・タスクに特化

3つは排他的ではなく、組み合わせて使うこともあります。

いつ使うか

  • FTが向く場面 特定の業界用語・文体・フォーマットに一貫して合わせたい、分類タスクの精度を上げたい
  • FTが向かない場面 頻繁に更新される知識が必要(→RAG)、データが少ない、コストを抑えたい(→プロンプト)
  • 注意点 学習データの品質・バイアスがモデルに反映される。過学習・幻覚(ハルシネーション)のリスク

試験での出題ポイント

試験 出題の傾向 演習
G検定 転移学習、事前学習との関係、生成AI応用 domain-05 · 機械学習分野
生成AIパスポート 第2〜3章でFTとRAGの使い分けが頻出 第2章 · 第3章
  • 定義の選択 事前学習済みモデルの追加学習であること
  • FT vs RAG モデル更新 vs 外部データ参照の違い
  • 誤解の排除 FT=プロンプトの工夫、FT=RAG、などの混同

よくある質問

ファインチューニングとは何ですか?

事前学習済みモデルを特定タスク向けに追加学習する手法です。用語辞典で詳しく解説しています。

ファインチューニングとRAGの違いは?

FTはモデルの重みを更新、RAGは外部データを検索して参照します。RAGの解説も参照してください。

LoRAはファインチューニングの一種ですか?

はい。パラメータ効率の良いFT手法です。LoRAの用語辞典もご覧ください。

どの試験で出題されますか?

G検定と生成AIパスポートの両方です。RAGとの使い分けを重点的に学習しましょう。