問題
データ前処理に関する説明として、最も不適切な選択肢を1つ選べ。
- A. 欠損値や外れ値の扱いを検討する
- B. データ形式をモデルが扱いやすい形に整える
- C. 訓練データと評価データの分離に注意する
- D. 評価データの情報を前処理で訓練側に漏らすほど、汎化性能を正確に測れる
G検定 実践演習の問題です。解説付きで個別に学習できます。
データ前処理に関する説明として、最も不適切な選択肢を1つ選べ。
正解はD。評価データの情報が訓練側へ漏れると、データリーケージにより性能が過大評価される可能性がある。前処理では、訓練データと評価データの分離を意識する必要がある。AからCは適切な説明である。