G-104 · 強化学習

G検定の実践演習模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

機械学習の概要標準 ID: G-104

問題

以下の説明に対応する名称の組み合わせとして、最も適切な選択肢を1つ選べ。（あ）現在の方策に従って更新する手法の考え方（い）現在の方策とは異なる方策を仮定して更新できる手法の考え方

A. （あ）オンポリシー　（い）オフポリシー
B. （あ）オフポリシー　（い）オンポリシー
C. （あ）教師あり　（い）教師なし
D. （あ）分類　（い）回帰

解説（正解: A）

正解はA。オンポリシーは、現在実際に使っている方策に従った経験をもとに更新する考え方である。オフポリシーは、行動を選ぶ方策と評価・改善したい方策が異なっていても学習できる考え方である。SARSAはオンポリシー、Q学習はオフポリシーとして説明されることが多い。

演習モードで解く前の問題次の問題

関連キーワード

G検定実践演習機械学習の概要用語辞典強化学習学習

同じトピックの問題