強化学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 標準 ID: G-076

問題

以下の説明に対応する名称の組み合わせとして、最も適切な選択肢を1つ選べ。(あ)方策を評価・改善する役割(い)価値関数を推定する役割

  1. A. (あ)Actor (い)Critic
  2. B. (あ)Critic (い)Actor
  3. C. (あ)Encoder (い)Decoder
  4. D. (あ)Generator (い)Discriminator

解説(正解: A)

正解はA。Actor-Criticでは、Actorが方策に基づいて行動を選び、Criticが価値関数を推定してActorの更新を助ける。価値ベースと方策ベースの考え方を組み合わせた手法として理解するとよい。CはSeq2Seqなど、DはGANに関する用語である。

演習モードで解く 前の問題 次の問題