基礎・機械学習

推論(Inference)とは?学習済みモデルでの予測

読み:すいろん / 英:Inference

更新日: 読了目安:約7分

推論(Inference)は、学習済みのモデルに新しい入力を与え、予測・分類・生成などの出力を得る処理です。本記事はインフラ詳細ではなく、学習との対比と「推論」という語のすり替え——試験で混同されやすい点——に焦点を当てます。

試験で問われる見方

機械学習文脈では、推論は学習済みモデルを用いて判断や結論を出す処理です。データ収集そのものではない(TF-309×)。

ドロップアウトは学習時の正則化であり、推論時に入力データを削除する手法ではない(TF-395)。量子化などは推論の高速化に役立つことがある(G-406)。

演習で確認する

G検定:TF-309TF-395G-406TF-308(記号AIの推論)

推論とは

学習で得た重みを固定し、新しい入力に対して順伝播(または生成ステップ)を実行して出力します。画像分類ならラベル確率、LLMなら次のトークン、画像生成ならピクセル列——いずれも推論フェーズの成果です。

本番APIでユーザーが体験するのは、多くの場合推論です。学習はオフライン・バッチで行われることが多いです。

同音異義の整理

文脈推論の意味試験
機械学習学習済みモデルでの予測(本記事)TF-309
記号AI・古典AIルールや知識から結論を導くTF-308
統計・因果因果推論など別の専門用法文脈で判断

問題文の分野(ディープラーニング vs 人工知能概論)でどちらの「推論」かを見分けます。

学習との違い

学習推論
重み更新する固定(通常)
損失・逆伝播使う使わない(通常)
ドロップアウト有効化しうる通常オフ(TF-395)
コスト長時間・大量データレイテンシ・スループットが課題

実務での論点

  • レイテンシ — 対話型AIでは応答速度が重要
  • スケール — 同時リクエスト数に応じたGPU等の割当
  • コスト — 推論1回あたりのトークン・電力
  • 品質 — 推論結果の監視・ハルシネーション対策

すり替えに注意

誤った説明正しい理解
推論=データ収集学習済みモデルで予測(TF-309
推論時もドロップアウトで入力削除学習時の正則化(TF-395
推論=学習予測実行 vs パラメータ更新
MLの推論=記号論理のみ文脈により意味が異なる(TF-308)

よくある質問

推論と予測は同じ?

日常ではほぼ同義です。回帰・分類・生成いずれも推論フェーズの出力と言えます。

エッジ推論とは?

クラウドではなく端末側で推論すること。遅延・プライバシーの観点で使われます。試験では詳細実装より概念で十分なことが多いです。

ChatGPTの応答は推論?

はい。学習済みLLMにプロンプトを入力しトークンを生成するのが推論です。