強化学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 標準 ID: G-073

問題

バンディットアルゴリズムに関する説明として、最も適切な選択肢を1つ選べ。

  1. A. 複数の選択肢から、探索と活用のバランスを取りながら報酬の高い選択を学ぶ枠組みである
  2. B. 画像の各画素をクラスに分類するセグメンテーション専用の手法である
  3. C. 教師あり学習で目的変数の二乗誤差だけを最小化する線形モデルである
  4. D. 文書を単語の出現頻度だけで表す自然言語処理手法である

解説(正解: A)

正解はA。バンディットアルゴリズムは、複数の選択肢の中から報酬が高いものを見つけるために、探索と活用のバランスを取る問題として扱われる。広告配信や推薦の選択などで例示されることがある。Bは画像認識、Cは回帰、DはBoWに関する説明である。

演習モードで解く 前の問題 次の問題