生成AIパスポート 一問一答の問題です。解説付きで個別に学習できます。
強化学習は、行動の結果を評価せず、正解ラベルだけを暗記する学習方法である。
正解: ×
×です。強化学習では、エージェントが環境に対して行動し、その結果として得られる報酬を手がかりに学習します。正解ラベルだけを暗記する説明は、強化学習の特徴を捉えていません。