データの収集・加工・分析・学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

AIの社会実装に向けて 標準 ID: G-419

問題

データ前処理に関する説明として、最も不適切な選択肢を1つ選べ。

  1. A. 欠損値や外れ値の扱いを検討する
  2. B. データ形式をモデルが扱いやすい形に整える
  3. C. 訓練データと評価データの分離に注意する
  4. D. 評価データの情報を前処理で訓練側に漏らすほど、汎化性能を正確に測れる

解説(正解: D)

正解はD。評価データの情報が訓練側へ漏れると、データリーケージにより性能が過大評価される可能性がある。前処理では、訓練データと評価データの分離を意識する必要がある。AからCは適切な説明である。

演習モードで解く 前の問題 次の問題