推論(Inference)は、学習済みのモデルに新しい入力を与え、予測・分類・生成などの出力を得る処理です。本記事はインフラ詳細ではなく、学習との対比と「推論」という語のすり替え——試験で混同されやすい点——に焦点を当てます。
試験で問われる見方
機械学習文脈では、推論は学習済みモデルを用いて判断や結論を出す処理です。データ収集そのものではない(TF-309×)。
ドロップアウトは学習時の正則化であり、推論時に入力データを削除する手法ではない(TF-395)。量子化などは推論の高速化に役立つことがある(G-406)。
演習で確認する
推論とは
学習で得た重みを固定し、新しい入力に対して順伝播(または生成ステップ)を実行して出力します。画像分類ならラベル確率、LLMなら次のトークン、画像生成ならピクセル列——いずれも推論フェーズの成果です。
本番APIでユーザーが体験するのは、多くの場合推論です。学習はオフライン・バッチで行われることが多いです。
同音異義の整理
| 文脈 | 推論の意味 | 試験 |
|---|---|---|
| 機械学習 | 学習済みモデルでの予測(本記事) | TF-309 |
| 記号AI・古典AI | ルールや知識から結論を導く | TF-308○ |
| 統計・因果 | 因果推論など別の専門用法 | 文脈で判断 |
問題文の分野(ディープラーニング vs 人工知能概論)でどちらの「推論」かを見分けます。
学習との違い
| 学習 | 推論 | |
|---|---|---|
| 重み | 更新する | 固定(通常) |
| 損失・逆伝播 | 使う | 使わない(通常) |
| ドロップアウト | 有効化しうる | 通常オフ(TF-395) |
| コスト | 長時間・大量データ | レイテンシ・スループットが課題 |
実務での論点
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| 推論=データ収集 | 学習済みモデルで予測(TF-309) |
| 推論時もドロップアウトで入力削除 | 学習時の正則化(TF-395) |
| 推論=学習 | 予測実行 vs パラメータ更新 |
| MLの推論=記号論理のみ | 文脈により意味が異なる(TF-308) |
よくある質問
推論と予測は同じ?
日常ではほぼ同義です。回帰・分類・生成いずれも推論フェーズの出力と言えます。
エッジ推論とは?
クラウドではなく端末側で推論すること。遅延・プライバシーの観点で使われます。試験では詳細実装より概念で十分なことが多いです。
ChatGPTの応答は推論?
はい。学習済みLLMにプロンプトを入力しトークンを生成するのが推論です。