問題
プロジェクト導入前の確認会で、RLHFに関する記述として正しいものを1つ選びなさい。
- A. RLHFは、事前学習済みモデルを特定用途のデータで追加学習させること。
- B. RLHFは、人間のフィードバックを用いた強化学習により、出力を望ましい方向へ調整する手法。
- C. RLHFは、対話形式で文章生成や質問応答などを行うテキスト生成AIサービス。
- D. RLHFは、AIの出力や行動を人間の意図や価値観に沿うよう調整する考え方。
生成AIパスポート 実践演習の問題です。解説付きで個別に学習できます。
プロジェクト導入前の確認会で、RLHFに関する記述として正しいものを1つ選びなさい。
正解は2です。RLHFの正しい説明は「人間のフィードバックを用いた強化学習により、出力を望ましい方向へ調整する手法」です。正誤判断では、主語の用語と説明文の内容が対応しているかを確認します。もっともらしい説明でも、別の用語の定義を述べている場合は誤りです。第2章では、生成モデルや代表的なモデル名を、仕組みと役割で整理すると判断しやすくなります。復習時は、正答だけでなく、なぜ他の選択肢が別概念なのかを一言で説明できるようにしておくと効果的です。