問題
モデル選択で検証データを使う目的として、最も適切な選択肢を1つ選べ。
- A. 複数のモデルやハイパーパラメータ候補の中から、未知データでよさそうなものを選ぶため
- B. テストデータを訓練データとして何度も使い、最終評価を高く見せるため
- C. 正解ラベルをすべて削除し、教師なし学習だけに変換するため
- D. モデルの説明変数を法律上の個人情報に必ず変換するため
G検定 実践演習の問題です。解説付きで個別に学習できます。
モデル選択で検証データを使う目的として、最も適切な選択肢を1つ選べ。
正解はA。検証データは、複数のモデルやハイパーパラメータ候補を比較し、汎化性能がよさそうなものを選ぶために使われる。最終的な性能確認には、モデル選択に使っていないテストデータを使うのが望ましい。Bのようにテストデータを調整に使いすぎると、最終評価が過大になる可能性がある。