強化学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 基本 ID: G-077

問題

強化学習における方策に関する説明として、最も適切な選択肢を1つ選べ。

  1. A. 状態に応じてどの行動を選ぶかを決めるルールや確率分布である
  2. B. 教師あり学習で正解ラベルを保存する表である
  3. C. 分類問題で誤分類数だけを表す指標である
  4. D. クラスタリングでクラスタ中心の数を表す値である

解説(正解: A)

正解はA。方策は、エージェントがある状態でどの行動を取るかを決めるルールや確率分布である。強化学習では、報酬を最大化するように方策を改善することが目的になる。BからDは、方策ではなく教師あり学習、評価指標、クラスタリングに関する説明である。

演習モードで解く 前の問題 次の問題