推論（Inference）とは？学習済みモデルでの予測

推論（Inference）は、学習済みのモデルに新しい入力を与え、予測・分類・生成などの出力を得る処理です。本記事はインフラ詳細ではなく、学習との対比と「推論」という語のすり替え——試験で混同されやすい点——に焦点を当てます。

試験で問われる見方

機械学習文脈では、推論は学習済みモデルを用いて判断や結論を出す処理です。データ収集そのものではない（TF-309×）。

ドロップアウトは学習時の正則化であり、推論時に入力データを削除する手法ではない（TF-395）。量子化などは推論の高速化に役立つことがある（G-406）。

演習で確認する

G検定：TF-309、TF-395、G-406、TF-308（記号AIの推論）

学習で得た重みを固定し、新しい入力に対して順伝播（または生成ステップ）を実行して出力します。画像分類ならラベル確率、LLMなら次のトークン、画像生成ならピクセル列——いずれも推論フェーズの成果です。

本番APIでユーザーが体験するのは、多くの場合推論です。学習はオフライン・バッチで行われることが多いです。

問題文の分野（ディープラーニング vs 人工知能概論）でどちらの「推論」かを見分けます。

推論と予測は同じ？

日常ではほぼ同義です。回帰・分類・生成いずれも推論フェーズの出力と言えます。

エッジ推論とは？

クラウドではなく端末側で推論すること。遅延・プライバシーの観点で使われます。試験では詳細実装より概念で十分なことが多いです。

ChatGPTの応答は推論？

はい。学習済みLLMにプロンプトを入力しトークンを生成するのが推論です。