RNN(再帰型ニューラルネットワーク)は、過去の情報を内部状態(隠れ状態)に残しながら、時系列に沿って入力を処理するニューラルネットワークです。CNNが画像の空間パターンを扱うのに対し、RNNは時間の矢印に沿った系列——株価、音声、文章——を扱う設計として発展しました。本記事は数式の暗記ではなく、「なぜループ構造が系列に効くのか」と試験でのすり替え回避に焦点を当てます。
試験で問われる見方
定義の骨格は「系列データを扱うため、過去の情報を内部状態として利用するニューラルネットワーク」(HQ-0328)。
データとモデルの対応——系列→RNN、画像→CNN——が頻出です(G-239)。逆の対応を選ぶのは×です。
RNNは生成AIサービス名でもClaudeでもありません。製品説明が主語に付いた選択肢は別概念です(HQ-0328のB・C)。
RNNとは
RNNの「再帰(Recurrent)」は、同じ重みを時間ステップごとに繰り返し適用し、出力を次の入力にフィードバックする——というループ構造を指します。英語の Recurrent と日本語の「回帰」は別語です。試験文に「回帰型」と書かれることがありますが、正しくは再帰型です。
初期の代表例としてエルマンネットワーク(隠れ状態を次に渡す)やジョルダンネットワーク(出力を文脈に使う)が挙げられます(G-246)。細部の暗記より「ループで過去を覚える」イメージで十分なことが多いです。
向いているデータ
- 時系列予測 気温、株価、センサー値の次の値
- 文章の分類・タグ付け 各時刻の隠れ状態から感情や品詞を推定
- 音声・信号 時間軸に沿ったパターン認識。音声認識ではCTC損失と組み合わせることが多い
格子状の画像データはCNNの方が典型です。試験ではデータの形からモデルを選ぶ力が問われます。
限界と勾配問題
ループ構造は系列に効く一方、長い系列では学習が難しくなります。
| 問題 | ざっくりした意味 | 試験向け |
|---|---|---|
| 勾配消失 | 勾配がほぼゼロになり更新が止まる | 長期依存が学習しにくい |
| 勾配爆発 | 勾配が巨大になり不安定 | RNNで起こりやすい(G-136) |
| 対策の系譜 | LSTMなどゲート付きRNN | 長期依存の緩和(G-242) |
現代の大規模言語モデルはTransformerが主役ですが、RNNの限界——長距離依存の難しさ——を理解することが、Transformerの利点(Self-Attention)を押さえる近道になります。
CNN・Transformerとの対比
| RNN | CNN | Transformer | |
|---|---|---|---|
| 得意なデータ | 系列・時系列 | 画像の格子 | 言語系列(注意機構) |
| 処理の流れ | 順次(ループ) | 畳み込み走査 | 並列的な注意計算 |
| 長距離依存 | 苦労しやすい | 空間の遠方は層で | Attentionで直接 |
| 現代LLM | 主役ではない | 主役ではない | 基盤(TF-419) |
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| RNN=Claude / Copilot | 系列モデル vs 生成AIサービス |
| RNN=生成AIの定義 | HQ-0328のDは別概念 |
| 系列→CNNが典型 | G-239は逆 |
| 回帰型=線形回帰 | 再帰(Recurrent)の誤読に注意 |
| RNN=現代LLMの基盤 | Transformer系が主役 |
よくある質問
RNNの定義として正しいのは?
系列データを扱うため、過去の情報を内部状態として利用するニューラルネットワーク、と整理します。時系列データや文章など、順序のあるデータの処理に向いた設計です。
RNNとCNNの使い分けは?
RNNは時系列・文章など系列データ向き、CNNは画像の局所特徴抽出向き、と対比します。データの性質とモデル設計の対応が試験で問われます。
RNN=現代のLLMの基盤ですか?
現代の大規模言語モデルの主役はTransformer系です。RNNは系列処理の古典的アーキテクチャとして理解し、Transformerとの対比で押さえるのが試験向けです。