教師あり学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 標準 ID: G-067

問題

教師あり学習における訓練データとテストデータに関する説明として、最も不適切な選択肢を1つ選べ。

  1. A. 訓練データはモデルのパラメータを学習するために使われる
  2. B. テストデータは学習済みモデルの汎化性能を評価するために使われる
  3. C. テストデータの情報を使ってモデルを調整しすぎると、評価が過大になることがある
  4. D. テストデータは訓練データと完全に同じでなければ、モデル評価には使えない

解説(正解: D)

正解はD。テストデータは、モデルが未知データにどの程度対応できるかを確認するために、訓練データとは分けて用いる。訓練データと完全に同じデータで評価すると、汎化性能を適切に見積もれない。Cのように、テストデータの情報を使ってモデルを調整しすぎるとデータリーケージや評価の過大評価につながる。

演習モードで解く 前の問題 次の問題