強化学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 標準 ID: G-048

問題

以下の説明に対応する名称の組み合わせとして、最も適切な選択肢を1つ選べ。(あ)ある状態の良さを表す関数(い)ある状態で特定の行動を取る良さを表す関数

  1. A. (あ)状態価値関数 (い)行動価値関数
  2. B. (あ)行動価値関数 (い)状態価値関数
  3. C. (あ)損失関数 (い)活性化関数
  4. D. (あ)主成分 (い)固有値

解説(正解: A)

正解はA。状態価値関数は、ある状態にいることの価値を表し、行動価値関数は、ある状態で特定の行動を取ることの価値を表す。Q学習で扱うQ値は行動価値関数に対応する。強化学習では、価値関数を学ぶ方法と方策を直接学ぶ方法を区別して理解することが重要である。

演習モードで解く 前の問題 次の問題