Human-in-the-Loop(ヒューマンインザループ/HITL)は、AIの判断・学習・運用のループに人間が介在する設計です。本記事はRLHFの学習手法全体ではなく、いつ・誰が・何をするか——監督のパターンと限界——に焦点を当てます。
試験で問われる見方
定義:「人間がAIの判断や学習プロセスに関与する設計」(TF-199○)。確認・修正・承認・フィードバックなどが含まれます。
×:HITLを入れれば人間のミスやバイアスが必ず完全に除去される(TF-200)。×:AIと人間の誤りが常に完全に消える(TF-458)。
Human-in-the-Loopとは
AIを「一度設定したら放置」にせず、重要な局面で人の判断を挟むアーキテクチャです。学習段階ではラベル付けや好みの選択(RLHFの人間フィードバック)、運用段階では出力の承認やエスカレーションが典型例です。
関与のパターン
Human-in-the-Loop
各判断・出力に人が関与(承認、修正)
Human-on-the-Loop
AIが実行、人が監視・介入可能
Human-out-of-the-Loop
完全自動(低リスク用途向け。高リスクでは慎重に)
試験では主にHITLの定義と、高リスクでの関与強化が問われます。略語の細分化は深掘り不要なことが多いです。
完全自動化との対比
| 観点 | HITLあり | 完全自動 |
|---|---|---|
| 品質・安全 | 人が最終チェック | 速度は速いがリスク増 |
| コスト | 人件費・待ち時間 | 低いが誤りの影響大 |
| 高リスクAI | 推奨されやすい | TF-499の誤答パターン |
| 生成AI実務 | 対外文案の人レビュー | 下書き生成のみ自動 |
限界
- 人間も疲労・バイアス・見落としがある
- 形骸化( rubber-stamping )——承認が形だけになる
- ハルシネーションを人が見逃す可能性
- すべての出力に人レビューはスケールしない → リスクに応じた設計