データリーケージ

G検定 一問一答の問題です。解説付きで個別に学習できます。

機械学習の概要 標準 ID: TF-369

問題

データリーケージとは、本来学習時に使えない情報がモデル作成に混入してしまうことを指す。

正解: ○

解説

未来の情報やテストデータ由来の情報が学習に入ると、評価が不自然に高くなります。前処理や特徴量作成でもリーケージが起きるため注意が必要です。

演習モードで解く 前の問題 次の問題