モデルの選択・評価

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 応用 ID: G-060

問題

モデル評価におけるデータリーケージに関する説明として、最も不適切な選択肢を1つ選べ。

  1. A. 本来は学習時に利用できない情報が訓練データに混入すると、評価が過大になることがある
  2. B. 前処理を行う際にも、検証データの情報を学習側へ漏らさないよう注意が必要である
  3. C. データリーケージが起きると、実運用では期待した性能が出ない可能性がある
  4. D. データリーケージは評価を厳しくするため、モデルの性能を常に低く見積もる原因になる

解説(正解: D)

正解はD。データリーケージは、検証時や本番運用時には使えない情報が学習に混入することで、評価性能が不自然に高く見える原因になりやすい。実運用ではその情報が使えないため、期待した性能が出ないことがある。AからCはいずれもデータリーケージに関する適切な説明である。評価問題では、訓練データと検証データの分離を強く意識する。

演習モードで解く 前の問題 次の問題