強化学習

G検定 一問一答の問題です。解説付きで個別に学習できます。

機械学習の概要 基本 ID: TF-038

問題

強化学習では、エージェントが環境に行動し、得られる報酬をもとに方策を改善する。

正解: ○

解説

強化学習では、状態、行動、報酬、方策などが基本概念である。正解ラベルを直接与える教師あり学習とは異なり、試行錯誤を通じて報酬最大化を目指す。

演習モードで解く 前の問題 次の問題