問題
DQNに関する説明として、最も不適切な選択肢を1つ選べ。
- A. 行動価値関数をニューラルネットワークで近似する
- B. 強化学習の代表的な深層学習応用である
- C. 経験再生などの工夫が使われることがある
- D. 文書を潜在トピックに分解する教師なし学習手法そのものである
G検定 実践演習の問題です。解説付きで個別に学習できます。
DQNに関する説明として、最も不適切な選択肢を1つ選べ。
正解はD。DQNは深層強化学習の代表的手法であり、行動価値関数をニューラルネットワークで近似する。経験再生やターゲットネットワークなどの工夫が知られる。Dはトピックモデルに近い説明であり、DQNとは関係がない。