問題
新入社員向けの基礎研修で出されたRLHFに関する説明として、不適切なものを1つ選びなさい。
- A. RLHFは、関連する用語と区別して覚える必要がある。
- B. RLHFは、人間のフィードバックを用いた強化学習により、出力を望ましい方向へ調整する手法。
- C. RLHFを理解する際は、ChatGPTとの関係も確認するとよい。
- D. RLHFは、対話形式で文章生成や質問応答などを行うテキスト生成AIサービス。
生成AIパスポート 実践演習の問題です。解説付きで個別に学習できます。
新入社員向けの基礎研修で出されたRLHFに関する説明として、不適切なものを1つ選びなさい。
正解は4です。選択肢「RLHFは、対話形式で文章生成や質問応答などを行うテキスト生成AIサービス。」は、RLHFではなく別の概念の説明です。RLHFの要点は「人間のフィードバックを用いた強化学習により、出力を望ましい方向へ調整する手法」であり、不適切選択では別分野の説明が混ざっていないかを確認します。正しい説明が複数あるように見える場合でも、主語と説明の対応がずれている選択肢を探すと判断しやすくなります。第2章では、生成モデルや代表的なモデル名を、仕組みと役割で整理すると判断しやすくなります。誤答を読むときは、語句の一部だけで判断せず、説明全体がその用語の定義と対応しているかを確認しましょう。