CNN(畳み込みニューラルネットワーク)は、画像の局所的なパターン——エッジ、模様、形——を畳み込みフィルターで段階的に抽出する深層学習のアーキテクチャです。LLMやChatGPTが言語の世界を担うのに対し、CNNは長く画像認識の「目」として位置づけられてきました。本記事は層の数式暗記ではなく、「なぜ畳み込みが画像に効くのか」と試験でのすり替え回避に焦点を当てます。
試験で問われる見方
定義の骨格は「画像などの局所的な特徴を畳み込み処理で捉えるニューラルネットワーク」(HQ-0298、TF-401)。
誤答では、CNN=GAN(生成器と識別器を競わせるモデル:HQ-0322)、CNN=ClaudeやChatGPT(TF-0145)など、別概念の説明が主語だけ差し替えられているパターンに注意します。
データとモデルの対応——画像→CNN、系列→RNN——も頻出です(G-239)。
CNNとは
CNNは、画像分類・物体検出・顔認識など格子状データ(ピクセル格子)の認識で広く使われてきたネットワーク構造です。物体検出の性能はCOCOなどの標準ベンチマークで比較されることが多いです。全結合層だけではパラメータが爆発し、空間的な局所性を活かしにくい——という課題に対し、畳み込み層が「近傍だけを見るフィルター」を繰り返し適用する設計で応えました。
現代の画像生成は拡散モデルなど別系統が主役ですが、試験ではCNNが画像認識の古典的基盤として問われることが多く、理解の土台として重要です。
畳み込みの直感
小さなフィルター(カーネル)を画像上でスライドさせ、各位置で内積を取る——これが畳み込みの基本イメージです。
- 局所性 — 一度に見るのは小さな領域(3×3など)。遠くのピクセルは後段の層で間接的に
- 同じフィルターを全体に適用 — 左上のエッジも右下のエッジも同じ検出器で探す
- スライドして走査 — 画像全体を網羅し特徴マップを得る
- 段階を重ねる — 浅い層はエッジ、深い層は部品・物体らしさへ
「畳み込み=画像を圧縮して消す」ではなく、特徴を抽出して表現を変換する——という理解が試験向けです。
低次→高次の階層
| 層の深さ | 捉えやすい特徴 | 例 |
|---|---|---|
| 浅い層 | 低次特徴 | エッジ、色の境界、単純な模様 |
| 中間層 | 中次特徴 | 角、テクスチャ、目・鼻のような部品 |
| 深い層 | 高次特徴 | 顔、車、動物といった物体カテゴリ |
TF-401の解説にあるように、低次から高次へ段階的に表現を学習する——この階層性がCNNの試験要点です。
重み共有とプーリング
畳み込み層の設計思想で、試験に触れやすい二点です。
| 概念 | 意味 | 試験向け |
|---|---|---|
| 重み共有 | 同じフィルターを画像全体に適用 | パラメータ削減・位置不変性(G-275) |
| プーリング | 領域を要約して次元を下げる | 計算効率・大まかな位置の頑健性 |
「重み共有=学習しない」は誤りです。共有するのはパラメータの使い方であり、フィルター自体は学習で更新されます。
RNN・GAN・LLMとの区別
| 用語 | 何を指すか | CNNとの関係 |
|---|---|---|
| CNN | 畳み込みを中心としたネット構造 | —— |
| GAN | 生成器と識別器の対戦学習 | 別枠組み。識別器にCNNを使うことはあるが同一ではない |
| RNN | 系列の順次処理 | 画像 vs 時系列の典型対比(G-239) |
| Transformer / LLM | 言語の注意機構・大規模言語モデル | 別ドメイン。Claude≠CNN(TF-0145) |
CNNは構造の名前、GANは学習の枠組み、LLMは言語モデルのクラス——層を混同しないことが生成AIパスポート第2章の得点源です。
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| CNN=GAN | HQ-0322。構造 vs 生成の枠組み |
| CNN=ChatGPT | 画像認識の基盤 vs 対話サービス |
| CNN=BERT | 画像畳み込み vs NLPエンコーダ |
| 画像→RNNが典型 | G-239は逆。画像→CNN |
| CNN=物体検出そのもの | Faster R-CNN等はCNNを含むが別モデル名 |
よくある質問
CNNの定義として正しいのは?
画像などの局所的な特徴を畳み込み処理で捉えるニューラルネットワーク、と整理します。エッジや模様などの低次特徴から、より高次の特徴へ段階的に表現を学習する点が試験の要点です。
CNNとGANの違いは?
CNNは畳み込み層を中心としたネットワーク構造の一種です。GANは生成器と識別器を競わせる生成モデルの枠組みであり、CNN=GANとは答えません。
CNNとRNNの使い分けは?
CNNは画像の局所特徴抽出向き、RNNは時系列や文章など順序データの処理向き、と対比します。データの性質とモデルの設計思想の対応が試験で問われます。