問題
クラスタリング結果の解釈に関する注意点として、最も適切な選択肢を1つ選べ。
- A. 得られたクラスタは、手法や距離尺度、特徴量の選び方によって変わり得るため、業務知識と合わせて解釈する必要がある
- B. クラスタリングでは必ず正解ラベルがあるため、解釈の余地はない
- C. クラスタ数を増やせば、常に実用上最も良い結果になる
- D. クラスタリング結果は法律上の個人情報とは絶対に無関係である
G検定 実践演習の問題です。解説付きで個別に学習できます。
クラスタリング結果の解釈に関する注意点として、最も適切な選択肢を1つ選べ。
正解はA。クラスタリングは教師なし学習であり、得られるグループは使う特徴量、距離尺度、クラスタ数、手法によって変化する。そのため、結果を機械的に受け入れるのではなく、業務上意味のある分類かを確認する必要がある。Bは教師なし学習の特徴を誤っており、Cのようにクラスタ数を増やせば常に良いわけではない。Dも不適切で、扱うデータによっては個人情報やプライバシーへの配慮が必要である。