ChatGPT

生成AIパスポート 一問一答の問題です。解説付きで個別に学習できます。

第2章 標準 ID: TF-0123

問題

RLHFは、正解ラベルなしのデータを自動的にクラスタへ分ける教師なし学習の手法である。

正解: ×

解説

×です。RLHFは、人間のフィードバックを用いた強化学習によって出力を調整する手法です。正解ラベルなしのデータをクラスタへ分ける説明は、教師なし学習やクラスタリングに近いものです。

演習モードで解く 前の問題 次の問題