問題
教師あり学習における訓練データとテストデータに関する説明として、最も不適切な選択肢を1つ選べ。
- A. 訓練データはモデルのパラメータを学習するために使われる
- B. テストデータは学習済みモデルの汎化性能を評価するために使われる
- C. テストデータの情報を使ってモデルを調整しすぎると、評価が過大になることがある
- D. テストデータは訓練データと完全に同じでなければ、モデル評価には使えない
G検定 実践演習の問題です。解説付きで個別に学習できます。
教師あり学習における訓練データとテストデータに関する説明として、最も不適切な選択肢を1つ選べ。
正解はD。テストデータは、モデルが未知データにどの程度対応できるかを確認するために、訓練データとは分けて用いる。訓練データと完全に同じデータで評価すると、汎化性能を適切に見積もれない。Cのように、テストデータの情報を使ってモデルを調整しすぎるとデータリーケージや評価の過大評価につながる。