TF-042 · 強化学習

G検定の一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

機械学習の概要標準 ID: TF-042

問題

ε-greedy方策は、一定確率で探索し、それ以外では現在よいと考える行動を選ぶ方策である。

正解: ○

解説

ε-greedy方策は、探索と活用のバランスを取る代表的な方法である。ランダム行動により未知の行動を試しつつ、既に価値が高い行動も選ぶ。

演習モードで解く前の問題次の問題

関連キーワード

G検定一問一答機械学習の概要用語辞典強化学習学習

同じトピックの問題