TF-043 · 強化学習

G検定の一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

機械学習の概要応用 ID: TF-043

問題

SARSAはオンポリシー手法として説明されることが多い。

正解: ○

解説

SARSAは、現在の方策に従って実際に選んだ次の行動を用いて更新するオンポリシー手法である。Q学習はオフポリシー手法として説明されることが多い。

演習モードで解く前の問題次の問題

関連キーワード

G検定一問一答機械学習の概要用語辞典強化学習学習

同じトピックの問題