データの収集・加工・分析・学習

G検定 実践演習の問題です。解説付きで個別に学習できます。

AIの社会実装に向けて 基本 ID: G-451

問題

AI開発におけるデータ品質の説明として、最も適切な選択肢を1つ選べ。

  1. A. 欠損、誤記、偏り、ラベル誤りなどが少なく、目的に合ったデータであることが重要である
  2. B. データ量が多ければ品質は一切確認しなくてよい
  3. C. データ品質はモデル性能と無関係である
  4. D. データ品質は契約書のページ数だけで決まる

解説(正解: A)

正解はA。AI開発では、データ量だけでなく品質が重要である。欠損値、外れ値、重複、ラベル誤り、サンプリングの偏りなどがあると、モデル性能や公平性に悪影響を与える。BからDはデータ品質の重要性を誤っている。

演習モードで解く 前の問題 次の問題