生成AIパスポート 一問一答の問題です。解説付きで個別に学習できます。
RLHFは、モデルの重みを一切変えずに、出力結果を手作業で紙に書き写す作業である。
正解: ×
×です。RLHFは、人間のフィードバックを使ってモデルの振る舞いを調整する機械学習上の手法です。出力を紙に書き写す事務作業ではありません。