強化学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 応用 ID: G-051

問題

SARSAとQ学習の違いに関する説明として、最も適切な選択肢を1つ選べ。

  1. A. SARSAは方策に従って実際に選んだ次の行動を用いて更新するオンポリシー手法である
  2. B. SARSAは教師なし学習であり、Q学習は教師あり学習である
  3. C. SARSAは画像認識専用であり、Q学習は自然言語処理専用である
  4. D. SARSAは報酬を使わず、Q学習だけが報酬を使う

解説(正解: A)

正解はA。SARSAは、現在の状態、行動、報酬、次状態、次に実際に選んだ行動を用いて更新するオンポリシーの代表的手法である。一方、Q学習は次状態で取り得る最大の行動価値を用いて更新するオフポリシー手法として説明される。BからDは強化学習の基本的な分類を誤っている。

演習モードで解く 前の問題 次の問題