TF-0165 · 生成AIの仕組み

生成AIパスポートの一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

第2章標準 ID: TF-0165

問題

RLHFは、人間のフィードバックを用いてモデルの出力を望ましい方向へ調整する考え方である。

正解: ○

○です。RLHFは、人間による評価やフィードバックを利用して、モデルがより望ましい応答を出しやすくするための調整手法です。単なる大量データの追加投入とは異なります。