CNNとは？局所パターンの階層——画像の「目」の設計

CNN（畳み込みニューラルネットワーク）は、画像の局所的なパターン——エッジ、模様、形——を畳み込みフィルターで段階的に抽出する深層学習のアーキテクチャです。LLMやChatGPTが言語の世界を担うのに対し、CNNは長く画像認識の「目」として位置づけられてきました。本記事は層の数式暗記ではなく、「なぜ畳み込みが画像に効くのか」と試験でのすり替え回避に焦点を当てます。

試験で問われる見方

定義の骨格は「画像などの局所的な特徴を畳み込み処理で捉えるニューラルネットワーク」（HQ-0298、TF-401）。

誤答では、CNN＝GAN（生成器と識別器を競わせるモデル：HQ-0322）、CNN＝ClaudeやChatGPT（TF-0145）など、別概念の説明が主語だけ差し替えられているパターンに注意します。

データとモデルの対応——画像→CNN、系列→RNN——も頻出です（G-239）。

演習で確認する

生成AIパスポート：HQ-0298（定義）、HQ-0322（GANすり替え）

G検定：TF-401、G-239（RNNとの対比）、G-275（畳み込み層）

CNNとは

CNNは、画像分類・物体検出・顔認識など格子状データ（ピクセル格子）の認識で広く使われてきたネットワーク構造です。物体検出の性能はCOCOなどの標準ベンチマークで比較されることが多いです。全結合層だけではパラメータが爆発し、空間的な局所性を活かしにくい——という課題に対し、畳み込み層が「近傍だけを見るフィルター」を繰り返し適用する設計で応えました。

現代の画像生成は拡散モデルなど別系統が主役ですが、試験ではCNNが画像認識の古典的基盤として問われることが多く、理解の土台として重要です。

畳み込みの直感

小さなフィルター（カーネル）を画像上でスライドさせ、各位置で内積を取る——これが畳み込みの基本イメージです。

局所性 — 一度に見るのは小さな領域（3×3など）。遠くのピクセルは後段の層で間接的に
同じフィルターを全体に適用 — 左上のエッジも右下のエッジも同じ検出器で探す
スライドして走査 — 画像全体を網羅し特徴マップを得る
段階を重ねる — 浅い層はエッジ、深い層は部品・物体らしさへ

「畳み込み＝画像を圧縮して消す」ではなく、特徴を抽出して表現を変換する——という理解が試験向けです。

低次→高次の階層

層の深さ	捉えやすい特徴	例
浅い層	低次特徴	エッジ、色の境界、単純な模様
中間層	中次特徴	角、テクスチャ、目・鼻のような部品
深い層	高次特徴	顔、車、動物といった物体カテゴリ

TF-401の解説にあるように、低次から高次へ段階的に表現を学習する——この階層性がCNNの試験要点です。

重み共有とプーリング

畳み込み層の設計思想で、試験に触れやすい二点です。

概念	意味	試験向け
重み共有	同じフィルターを画像全体に適用	パラメータ削減・位置不変性（G-275）
プーリング	領域を要約して次元を下げる	計算効率・大まかな位置の頑健性

「重み共有＝学習しない」は誤りです。共有するのはパラメータの使い方であり、フィルター自体は学習で更新されます。

RNN・GAN・LLMとの区別

用語	何を指すか	CNNとの関係
CNN	畳み込みを中心としたネット構造	——
GAN	生成器と識別器の対戦学習	別枠組み。識別器にCNNを使うことはあるが同一ではない
RNN	系列の順次処理	画像 vs 時系列の典型対比（G-239）
Transformer / LLM	言語の注意機構・大規模言語モデル	別ドメイン。Claude≠CNN（TF-0145）

CNNは構造の名前、GANは学習の枠組み、LLMは言語モデルのクラス——層を混同しないことが生成AIパスポート第2章の得点源です。

すり替えに注意

誤った説明	正しい理解
CNN＝GAN	HQ-0322。構造 vs 生成の枠組み
CNN＝ChatGPT	画像認識の基盤 vs 対話サービス
CNN＝BERT	画像畳み込み vs NLPエンコーダ
画像→RNNが典型	G-239は逆。画像→CNN
CNN＝物体検出そのもの	Faster R-CNN等はCNNを含むが別モデル名

よくある質問

CNNの定義として正しいのは？

画像などの局所的な特徴を畳み込み処理で捉えるニューラルネットワーク、と整理します。エッジや模様などの低次特徴から、より高次の特徴へ段階的に表現を学習する点が試験の要点です。

CNNとGANの違いは？

CNNは畳み込み層を中心としたネットワーク構造の一種です。GANは生成器と識別器を競わせる生成モデルの枠組みであり、CNN＝GANとは答えません。

CNNとRNNの使い分けは？

CNNは画像の局所特徴抽出向き、RNNは時系列や文章など順序データの処理向き、と対比します。データの性質とモデルの設計思想の対応が試験で問われます。