TF-148 · 深層強化学習

G検定の一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

ディープラーニングの応用例標準 ID: TF-148

問題

ダブルDQNは、DQNの行動価値の過大評価を抑えるための改良手法である。

正解: ○

解説

ダブルDQNは、行動選択と価値評価を分けることで、Q値の過大評価を緩和する。DQN系の改良として押さえる。

演習モードで解く前の問題次の問題

関連キーワード

G検定一問一答ディープラーニングの応用例用語辞典強化学習学習

同じトピックの問題