「数学が苦手でG検定が不安」——そう感じる受験者は少なくありません。しかしG検定の「AIに必要な数理・統計知識」は、大学数学のような複雑な計算問題ではなく、AIを理解するための基礎概念が中心です。本記事では、試験範囲・シラバスの数理・統計分野を、確率・統計・線形代数・微分・損失関数・頻出問題パターンに分けて、文系出身者にもわかりやすく整理します。公式の計算より「意味がわかるか」が合否の鍵です。
苦手でも大丈夫な理由
G検定はジェネラリスト向けの試験です。数学・統計分野の出題は次のような特徴があります。
- 計算より概念 複雑な積分や証明ではなく、「分散とは何か」「勾配の意味は」といった定義・使い分けが問われる
- 四肢択一形式 選択肢から正解を選ぶため、暗算のスピードより用語の理解が重要
- 他分野との関連 損失関数・評価指標などは機械学習分野でも登場し、文脈で覚えられる
- 1分野だけで合否は決まらない 200問中の一部であり、倫理・法律など他分野で得点を補える
確率の基礎
AIの不確実性を扱うための土台となる概念です。
- 確率 ある事象が起こる可能性を0〜1(または0〜100%)で表したもの
- 条件付き確率 ある事象が起きた前提での、別の事象の確率。P(A|B)のイメージ
- ベイズの定理 新しい証拠を得たとき、事前確率を事後確率に更新する公式。スパムフィルタなどに応用
- 期待値 確率変数がとりうる値の平均的な見込み。損失の期待値を最小化するのが学習の基本
- 独立・従属 2つの事象が互いに影響しないかどうか。データの独立性は統計手法の前提になる
統計の基礎
データの性質を記述し、推測するための概念です。
- 平均(期待値) データの中心的な値。外れ値の影響を受けやすい
- 分散・標準偏差 データのばらつきの大きさ。標準偏差は分散の平方根
- 正規分布 釣り鐘型の確率分布。多くの統計手法の前提として登場
- 標本と母集団 手元のデータ(標本)から全体(母集団)の性質を推測する
- 相関 2つの変数がどの程度一緒に増減するか。相関と因果は別物
- 仮説検定 仮説がデータに照らして妥当かを統計的に判断する手法の枠組み
線形代数の基礎
ディープラーニングの計算の裏側で使われる数学です。イメージが掴めれば十分なことが多いです。
- ベクトル 数の並び。データの1サンプルや特徴量の集合を表現
- 行列 数の表。ニューラルネットの重みは行列で表される
- 内積 2つのベクトルの類似度や重み付き和を計算。ニューロンの入力計算に対応
- 行列の積 層と層の間の変換。深層ネットワークの順伝播は行列演算の連鎖
- 次元 ベクトルの要素数。高次元データの可視化には次元削減(PCAなど)を使う
微分と勾配
機械学習の「学習」は、損失を最小化するパラメータ探索です。
- 微分 関数の変化率。ある点での「傾き」を表す
- 偏微分 多変数関数で、1つの変数だけを変化させたときの変化率
- 勾配 偏微分を並べたベクトル。損失関数が最も急に下がる方向を示す
- 勾配降下法 勾配の反対方向にパラメータを更新し、損失を最小化する最適化手法
- 学習率 1回の更新でどれだけ動くかのステップサイズ。大きすぎると発散、小さすぎると収束が遅い
機械学習との接続
数学・統計の知識が機械学習でどう使われるかを理解すると、記憶に残りやすくなります。
頻出問題パターン
- 用語の定義 「分散が大きいとは」「勾配とは何か」を正しく説明する選択肢を選ぶ
- 指標の使い分け 精度・適合率・再現率の定義と、不均衡データでの限界
- 確率の直感 ベイズの定理を使った簡単な更新問題、条件付き確率の計算
- 勾配降下法の挙動 学習率が大きすぎる・小さすぎるときの問題、局所最適解
- 相関と因果 相関があっても因果関係があるとは限らない、という論点
分野別演習で定着させる
G検定 一問一答「AIに必要な数理・統計知識」 — 数学・統計分野の演習