G検定 一問一答の問題です。解説付きで個別に学習できます。
ダブルDQNは、DQNの行動価値の過大評価を抑えるための改良手法である。
正解: ○
ダブルDQNは、行動選択と価値評価を分けることで、Q値の過大評価を緩和する。DQN系の改良として押さえる。