TF-040 · 強化学習

G検定の一問一答模擬問題です。解説付きで個別に学習できます（公式の過去問ではありません）。

機械学習の概要標準 ID: TF-040

問題

マルコフ決定過程は、状態・行動・報酬・遷移確率を用いて逐次的な意思決定を表すモデルである。

正解: ○

解説

マルコフ決定過程は強化学習の基礎的な定式化である。現在の状態と行動が次の状態や報酬に関係するという考え方を扱う。

演習モードで解く前の問題次の問題

関連キーワード

G検定一問一答機械学習の概要用語辞典強化学習モデル学習

同じトピックの問題