教師なし学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

機械学習の概要 応用 ID: G-072

問題

クラスタリング結果の解釈に関する注意点として、最も適切な選択肢を1つ選べ。

  1. A. 得られたクラスタは、手法や距離尺度、特徴量の選び方によって変わり得るため、業務知識と合わせて解釈する必要がある
  2. B. クラスタリングでは必ず正解ラベルがあるため、解釈の余地はない
  3. C. クラスタ数を増やせば、常に実用上最も良い結果になる
  4. D. クラスタリング結果は法律上の個人情報とは絶対に無関係である

解説(正解: A)

正解はA。クラスタリングは教師なし学習であり、得られるグループは使う特徴量、距離尺度、クラスタ数、手法によって変化する。そのため、結果を機械的に受け入れるのではなく、業務上意味のある分類かを確認する必要がある。Bは教師なし学習の特徴を誤っており、Cのようにクラスタ数を増やせば常に良いわけではない。Dも不適切で、扱うデータによっては個人情報やプライバシーへの配慮が必要である。

演習モードで解く 前の問題 次の問題