TF-041 · 強化学習

G検定の一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

機械学習の概要標準 ID: TF-041

問題

Q学習では、状態と行動の組み合わせに対する価値を更新しながら方策を改善していく。

正解: ○

解説

Q学習では、ある状態である行動を取る価値を表すQ値を更新する。価値ベースの強化学習手法として押さえる。

演習モードで解く前の問題次の問題

関連キーワード

G検定一問一答機械学習の概要用語辞典強化学習学習

同じトピックの問題