深層強化学習

G検定 一問一答の問題です。解説付きで個別に学習できます。

ディープラーニングの応用例 標準 ID: TF-148

問題

ダブルDQNは、DQNの行動価値の過大評価を抑えるための改良手法である。

正解: ○

解説

ダブルDQNは、行動選択と価値評価を分けることで、Q値の過大評価を緩和する。DQN系の改良として押さえる。

演習モードで解く 前の問題 次の問題