モデルの選択・評価

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 標準 ID: G-114

問題

モデル選択で検証データを使う目的として、最も適切な選択肢を1つ選べ。

  1. A. 複数のモデルやハイパーパラメータ候補の中から、未知データでよさそうなものを選ぶため
  2. B. テストデータを訓練データとして何度も使い、最終評価を高く見せるため
  3. C. 正解ラベルをすべて削除し、教師なし学習だけに変換するため
  4. D. モデルの説明変数を法律上の個人情報に必ず変換するため

解説(正解: A)

正解はA。検証データは、複数のモデルやハイパーパラメータ候補を比較し、汎化性能がよさそうなものを選ぶために使われる。最終的な性能確認には、モデル選択に使っていないテストデータを使うのが望ましい。Bのようにテストデータを調整に使いすぎると、最終評価が過大になる可能性がある。

演習モードで解く 前の問題 次の問題