モデルの選択・評価

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 標準 ID: G-008

問題

過学習に関する説明として、最も適切な選択肢を1つ選べ。

  1. A. 訓練データにはよく適合するが、未知データへの性能が低下している状態である
  2. B. 訓練データと検証データの両方で、常に性能が最大になる状態である
  3. C. 学習データが存在しない状態でモデルを作成することである
  4. D. モデルのパラメータ数を減らすと必ず発生する現象である

解説(正解: A)

正解はA。過学習は、訓練データに過度に適合した結果、未知データに対する性能が低下している状態である。訓練データ上の精度だけを見ると良く見えるが、実運用やテストデータでは性能が落ちることがある。対策として、正則化、データ拡張、早期終了、交差検証などが使われる。Bは理想的な状態のように見えるが、過学習の説明ではない。

演習モードで解く 前の問題 次の問題