モデル・技術

CNNとは?局所パターンの階層——画像の「目」の設計

読み:しーえぬえぬ / 英:CNN(Convolutional Neural Network/畳み込みニューラルネットワーク)

更新日: 読了目安:約7分

CNN(畳み込みニューラルネットワーク)は、画像の局所的なパターン——エッジ、模様、形——を畳み込みフィルターで段階的に抽出する深層学習のアーキテクチャです。LLMChatGPTが言語の世界を担うのに対し、CNNは長く画像認識の「目」として位置づけられてきました。本記事は層の数式暗記ではなく、「なぜ畳み込みが画像に効くのか」と試験でのすり替え回避に焦点を当てます。

試験で問われる見方

定義の骨格は「画像などの局所的な特徴を畳み込み処理で捉えるニューラルネットワーク」HQ-0298TF-401)。

誤答では、CNN=GAN(生成器と識別器を競わせるモデル:HQ-0322)、CNN=ClaudeやChatGPTTF-0145)など、別概念の説明が主語だけ差し替えられているパターンに注意します。

データとモデルの対応——画像→CNN、系列→RNN——も頻出です(G-239)。

演習で確認する

生成AIパスポート:HQ-0298(定義)HQ-0322(GANすり替え)

G検定:TF-401G-239(RNNとの対比)G-275(畳み込み層)

CNNとは

CNNは、画像分類・物体検出・顔認識など格子状データ(ピクセル格子)の認識で広く使われてきたネットワーク構造です。物体検出の性能はCOCOなどの標準ベンチマークで比較されることが多いです。全結合層だけではパラメータが爆発し、空間的な局所性を活かしにくい——という課題に対し、畳み込み層が「近傍だけを見るフィルター」を繰り返し適用する設計で応えました。

現代の画像生成は拡散モデルなど別系統が主役ですが、試験ではCNNが画像認識の古典的基盤として問われることが多く、理解の土台として重要です。

畳み込みの直感

小さなフィルター(カーネル)を画像上でスライドさせ、各位置で内積を取る——これが畳み込みの基本イメージです。

  1. 局所性 — 一度に見るのは小さな領域(3×3など)。遠くのピクセルは後段の層で間接的に
  2. 同じフィルターを全体に適用 — 左上のエッジも右下のエッジも同じ検出器で探す
  3. スライドして走査 — 画像全体を網羅し特徴マップを得る
  4. 段階を重ねる — 浅い層はエッジ、深い層は部品・物体らしさへ

「畳み込み=画像を圧縮して消す」ではなく、特徴を抽出して表現を変換する——という理解が試験向けです。

低次→高次の階層

層の深さ捉えやすい特徴
浅い層低次特徴エッジ、色の境界、単純な模様
中間層中次特徴角、テクスチャ、目・鼻のような部品
深い層高次特徴顔、車、動物といった物体カテゴリ

TF-401の解説にあるように、低次から高次へ段階的に表現を学習する——この階層性がCNNの試験要点です。

重み共有とプーリング

畳み込み層の設計思想で、試験に触れやすい二点です。

概念意味試験向け
重み共有同じフィルターを画像全体に適用パラメータ削減・位置不変性(G-275)
プーリング領域を要約して次元を下げる計算効率・大まかな位置の頑健性

「重み共有=学習しない」は誤りです。共有するのはパラメータの使い方であり、フィルター自体は学習で更新されます。

RNN・GAN・LLMとの区別

用語何を指すかCNNとの関係
CNN畳み込みを中心としたネット構造——
GAN生成器と識別器の対戦学習別枠組み。識別器にCNNを使うことはあるが同一ではない
RNN系列の順次処理画像 vs 時系列の典型対比(G-239)
Transformer / LLM言語の注意機構・大規模言語モデル別ドメイン。Claude≠CNN(TF-0145)

CNNは構造の名前、GANは学習の枠組み、LLMは言語モデルのクラス——層を混同しないことが生成AIパスポート第2章の得点源です。

すり替えに注意

誤った説明正しい理解
CNN=GANHQ-0322。構造 vs 生成の枠組み
CNN=ChatGPT画像認識の基盤 vs 対話サービス
CNN=BERT画像畳み込み vs NLPエンコーダ
画像→RNNが典型G-239は逆。画像→CNN
CNN=物体検出そのものFaster R-CNN等はCNNを含むが別モデル名

よくある質問

CNNの定義として正しいのは?

画像などの局所的な特徴を畳み込み処理で捉えるニューラルネットワーク、と整理します。エッジや模様などの低次特徴から、より高次の特徴へ段階的に表現を学習する点が試験の要点です。

CNNとGANの違いは?

CNNは畳み込み層を中心としたネットワーク構造の一種です。GANは生成器と識別器を競わせる生成モデルの枠組みであり、CNN=GANとは答えません。

CNNとRNNの使い分けは?

CNNは画像の局所特徴抽出向き、RNNは時系列や文章など順序データの処理向き、と対比します。データの性質とモデルの設計思想の対応が試験で問われます。