問題
管理職向けAIリスク研修として、「人間のフィードバックを用いた強化学習により、出力を望ましい方向へ調整する手法」に該当するキーワードを1つ選びなさい。
- A. ファインチューニング
- B. RLHF
- C. ChatGPT
- D. アライメント
生成AIパスポート 実践演習の問題です。解説付きで個別に学習できます。
管理職向けAIリスク研修として、「人間のフィードバックを用いた強化学習により、出力を望ましい方向へ調整する手法」に該当するキーワードを1つ選びなさい。
正解は2です。説明文はRLHFの定義に対応しています。用語を選ぶ問題では、説明文の中の対象、目的、仕組みを拾うと、近い用語との違いを見分けやすくなります。特にカタカナ語や略語は、名称ではなく意味から選べるようにしておくと、選択肢が入れ替わっても対応できます。第2章では、生成モデルや代表的なモデル名を、仕組みと役割で整理すると判断しやすくなります。復習時は、正答だけでなく、なぜ他の選択肢が別概念なのかを一言で説明できるようにしておくと効果的です。