シグモイド関数とは？S字で確率に写す——深層の主役を退いた古典の出口

シグモイド関数（Sigmoid）は、任意の実数入力を0〜1のS字カーブへ写す活性化関数です。ロジスティック回帰の「確率」、二値分類の出力層、LSTMのゲート——本記事は数式の暗記より、「なぜ深層の隠れ層からReLUに主役が移ったか」と「今もどこで使われるか」に焦点を当てます。

試験で問われる見方

シグモイドの定義は「入力を0から1の範囲に変換する活性化関数」です（G-121、G-157）。二値分類の確率表現（G-121）と、出力範囲の誤り（-1〜1は×——G-157、TF-060）が定番です。

活性化関数全体では、G-203のように「ないと線形の重ね合わせになる」——非線形性の導入——と、G-193の層・タスクごとの使い分けが問われます。

演習で確認する

G検定：G-121（シグモイド vs ソフトマックス）、G-157（出力範囲）、G-032（ロジスティック回帰）、G-158（ReLUとの対比）

S字カーブの直感

シグモイドは、入力が小さいときは0に近い、大きいときは1に近い——その間をなだらかなS字でつなぎます。いわば「0か1かの境界を、ソフトに確率へ変換する」関数です。

入力の傾向	出力	試験向け
大きく正	1に近づく	「陽性」の確率が高い
0付近	約0.5	境界線上
大きく負	0に近づく	「陰性」の確率が高い

G-032のロジスティック回帰は、このシグモイドでクラスに属する確率を推定する分類手法です。名称に「回帰」とあるため連続値予測と混同しやすい——試験では分類として押さえます。

使われる場所

シグモイドは「どこに置くか」で意味が変わります。試験では層とタスクの対応が重要です（G-193）。

二値分類の出力層 「このメールはスパムか？」→ 確率0.87（G-121）
ロジスティック回帰 古典的な分類の確率出力（G-032）
LSTM・GRUのゲート どれだけ情報を通すかを0〜1で制御——LSTM内部でもシグモイドが使われる
隠れ層（過去） 深層化以前は隠れ層の活性化にも使われたが、今のCNNの主役はReLU

ReLU・Softmaxとの役割分担

関数	主な出力範囲	主な置き場所	試験
シグモイド	0〜1	二値分類の出力層	G-121
ソフトマックス	合計1の確率分布	多クラス分類の出力層	G-121
ReLU	0以上（負は0）	隠れ層	G-011、G-158
tanh	-1〜1	隠れ層（一部）・RNN系	G-122

G-121の正解パターン——（あ）シグモイド　（い）ソフトマックス——は暗記どころか、二値 vs 多クラスの出口の違いを表しています。ReLUを出力層の確率変換に使うのは通常の設計ではありません。

飽和と勾配消失

シグモイドの弱点は、入力の絶対値が大きい領域——カーブがほぼ水平になる飽和域——で勾配が小さくなることです（G-157、G-122）。

勾配消失 — 深い層ほど誤差が伝わりにくい（G-124、TF-392）
ReLUの台頭 — 正の領域で勾配が一定 → 深層でも学習しやすい（G-158）
He初期化 — ReLU時代の重み初期化（He初期化）。シグモイド時代はXavier（Glorot）想定

だから「シグモイド＝悪」ではなく、深い隠れ層の主役を退いた——一方、出力層の二値確率やLSTMゲートでは今も現役——という整理が試験向けです。

深層学習史での位置

初期のニューラルネットでは、隠れ層にもシグモイドやtanhが使われました。AlexNet（2012）以降、ReLUが隠れ層のデフォルトに——G-319——シグモイドは「深層を育てる活性化」から「確率に写す出口」へ役割が狭まった、と歴史を一望すると理解が定着します。

G-160が列挙する活性化関数の代表——ReLU、シグモイド、tanh、ソフトマックス——は、時代と層で使い分けられた道具箱です。名前だけでなく「どの層で何のために」をセットで覚えると、G-193のような総合問題にも対応できます。

すり替えに注意

誤った説明	正しい理解
出力は-1〜1	0〜1（G-157、TF-060）。-1〜1はtanh
シグモイド＝ソフトマックス	二値確率 vs 多クラス分布（G-121）
シグモイド＝ReLU	出力層の確率変換 vs 隠れ層の非線形（G-158）
隠れ層の第一選択	現代の深層CNNではReLUが主流
シグモイド＝ロジスティック回帰そのもの	関数 vs 分類モデル全体（G-032）
活性化がなくても深層は十分	線形の重ね合わせに近くなる（G-203）

よくある質問

シグモイド関数の出力範囲は？

0から1の範囲です。入力が大きく正でも1に近づき、大きく負でも0に近づくS字状の曲線を描きます。-1から1の範囲はtanh関数の出力であり、シグモイドの範囲ではありません（G-157）。

シグモイド関数とReLUは同じ用途ですか？

主な用途は異なります。ReLUは隠れ層で広く使われ、負の入力を0に切り捨てます。シグモイドは二値分類の出力層で確率を0〜1に写す場合や、LSTMのゲートなどで使われます。深い隠れ層の主役はReLU時代に移りました（G-158）。

シグモイド関数とソフトマックス関数は同じですか？

同じではありません。シグモイドは主に二値分類で1つの出力を0〜1の確率に変換します。ソフトマックスは多クラス分類の出力層で、複数クラスの確率を合計1の分布に変換します（G-121）。