基礎・モデル技術

ディープラーニングとは?Deep Learning・多層ニューラルネット

読み:でぃーぷらーにんぐ / 英:Deep Learning(DL)

更新日: 読了目安:約7分

ディープラーニング(Deep Learning/DL)は、多層のニューラルネットワークで複雑な特徴を学ぶ機械学習の一分野です。本記事はCNNの詳細ではなく、試験で問われる「なぜ深い層か」「いつ単純MLで十分か」「GPUとの関係」に焦点を当てます。

試験で問われる見方

○:ディープラーニングは機械学習の一分野で、多層NNが特徴(TF-004)。多層パーセプトロンは入力・隠れ・出力層を持つ(TF-053)。

×:DLは計算量が少なくGPUと無関係TF-335)。大規模な行列演算のためGPU等が重要。

○:強力だが十分なデータ・計算資源・適切な設計・評価が必要。タスクによっては単純なMLの方が実用的な場合もある(TF-054)。

演習で確認する

G検定:TF-004TF-053TF-054TF-335ディープラーニングの概要

ディープラーニングとは

「Deep」は隠れ層が多い(深い)ニューラルネットを指します。浅いNNでは表現しきれない画像のエッジ→形状→物体といった階層的特徴を、層を重ねることで自動獲得できます。

学習は誤差逆伝播法勾配降下法の組み合わせが基本です。損失関数を最小化しながら重みを更新します。

深い層の意味

各層は前層の出力を非線形変換し、より抽象度の高い表現へ写像します。画像ならピクセル→エッジ→パーツ→クラス、自然言語なら文字→語→文脈→意味、というイメージです。

層が増えると表現力は上がりますが、過学習や学習の不安定化のリスクも増えます。ドロップアウトや正則化、データ拡張などの対策がセットで問われます。

実用化の三条件

条件なぜ必要か
データ量パラメータが多いほど多様な例が必要
計算資源学習は大量の行列演算(GPUが加速)
設計・評価アーキテクチャ選定と汎化性能の検証

「DLなら常に最高精度」は誤り。データが少ない・解釈性が重要なタスクでは、決定木や線形モデルが選ばれることもあります。

代表アーキテクチャ

試験では名前と用途の対応がよく出ます。

  • CNN — 画像認識(畳み込みで局所特徴)
  • RNN / LSTM / GRU — 系列データ(時系列・文)
  • Transformer — 自己注意機構。現代のLLMの基盤
  • GAN・拡散モデル生成AIStable Diffusionなど)

よくある質問

ニューラルネットとディープラーニングの違いは?

ニューラルネットは計算モデル全般、ディープラーニングは層を深くしたNNを学習する手法・分野です。1〜2層のNNだけでは「ディープ」と呼ばないことが多いです。

推論時もGPUが必須?

学習ほどではありませんが、大規模モデルは推論でもGPUや専用チップが使われます。エッジ端末では軽量化技術が重要です。

生成AIはすべてDL?

現状の主要な生成AI(LLM、画像生成)はディープラーニングが中核です。ただし生成AIは「目的」(生成)、DLは「手法」の軸で、概念は交差します。