問題
以下の文章を読み、空欄に最もよく当てはまる選択肢を1つ選べ。強化学習で、将来の報酬を現在の価値にどの程度反映するかを調整する係数は( )である。
- A. 割引率
- B. 学習率
- C. 適合率
- D. 標準偏差
G検定 実践演習の問題です。解説付きで個別に学習できます。
以下の文章を読み、空欄に最もよく当てはまる選択肢を1つ選べ。強化学習で、将来の報酬を現在の価値にどの程度反映するかを調整する係数は( )である。
正解はA。割引率は、将来得られる報酬を現在の価値評価にどの程度反映するかを決める係数である。割引率が大きいほど将来の報酬を重視し、小さいほど直近の報酬を重視する。Bの学習率はパラメータ更新幅、Cは分類評価指標、Dは統計上のばらつきの指標である。