深層強化学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

ディープラーニングの応用例 標準 ID: G-365

問題

デュエリングネットワークに関する説明として、最も適切な選択肢を1つ選べ。

  1. A. 状態価値と行動の優位性を分けて推定するDQN系の構造である
  2. B. 2つの物体検出モデルを競わせる画像認識手法である
  3. C. 2人の話者を必ず同時に識別する音声処理手法である
  4. D. AI契約の紛争解決条項である

解説(正解: A)

正解はA。デュエリングネットワークは、状態価値と各行動の優位性を分けて推定するDQN系の構造である。どの状態が良いかと、どの行動が相対的に良いかを分けて学習する狙いがある。BからDはデュエリングネットワークの説明ではない。

演習モードで解く 前の問題 次の問題