モデル・技術

シグモイド関数とは?S字で確率に写す——深層の主役を退いた古典の出口

読み:しぐもいど / 英:Sigmoid

更新日: 読了目安:約7分

シグモイド関数(Sigmoid)は、任意の実数入力を0〜1のS字カーブへ写す活性化関数です。ロジスティック回帰の「確率」、二値分類の出力層、LSTMのゲート——本記事は数式の暗記より、「なぜ深層の隠れ層からReLUに主役が移ったか」「今もどこで使われるか」に焦点を当てます。

試験で問われる見方

シグモイドの定義は「入力を0から1の範囲に変換する活性化関数」です(G-121G-157)。二値分類の確率表現(G-121)と、出力範囲の誤り(-1〜1は×——G-157、TF-060)が定番です。

活性化関数全体では、G-203のように「ないと線形の重ね合わせになる」——非線形性の導入——と、G-193層・タスクごとの使い分けが問われます。

S字カーブの直感

シグモイドは、入力が小さいときは0に近い、大きいときは1に近い——その間をなだらかなS字でつなぎます。いわば「0か1かの境界を、ソフトに確率へ変換する」関数です。

入力の傾向出力試験向け
大きく正1に近づく「陽性」の確率が高い
0付近約0.5境界線上
大きく負0に近づく「陰性」の確率が高い

G-032のロジスティック回帰は、このシグモイドでクラスに属する確率を推定する分類手法です。名称に「回帰」とあるため連続値予測と混同しやすい——試験では分類として押さえます。

使われる場所

シグモイドは「どこに置くか」で意味が変わります。試験では層とタスクの対応が重要です(G-193)。

  • 二値分類の出力層 「このメールはスパムか?」→ 確率0.87(G-121)
  • ロジスティック回帰 古典的な分類の確率出力(G-032)
  • LSTM・GRUのゲート どれだけ情報を通すかを0〜1で制御——LSTM内部でもシグモイドが使われる
  • 隠れ層(過去) 深層化以前は隠れ層の活性化にも使われたが、今のCNNの主役はReLU

ReLU・Softmaxとの役割分担

関数主な出力範囲主な置き場所試験
シグモイド0〜1二値分類の出力層G-121
ソフトマックス合計1の確率分布多クラス分類の出力層G-121
ReLU0以上(負は0)隠れ層G-011、G-158
tanh-1〜1隠れ層(一部)・RNN系G-122

G-121の正解パターン——(あ)シグモイド (い)ソフトマックス——は暗記どころか、二値 vs 多クラスの出口の違いを表しています。ReLUを出力層の確率変換に使うのは通常の設計ではありません。

飽和と勾配消失

シグモイドの弱点は、入力の絶対値が大きい領域——カーブがほぼ水平になる飽和域——で勾配が小さくなることです(G-157、G-122)。

  • 勾配消失 — 深い層ほど誤差が伝わりにくい(G-124TF-392
  • ReLUの台頭 — 正の領域で勾配が一定 → 深層でも学習しやすい(G-158)
  • He初期化 — ReLU時代の重み初期化(He初期化)。シグモイド時代はXavier(Glorot)想定

だから「シグモイド=悪」ではなく、深い隠れ層の主役を退いた——一方、出力層の二値確率やLSTMゲートでは今も現役——という整理が試験向けです。

深層学習史での位置

初期のニューラルネットでは、隠れ層にもシグモイドやtanhが使われました。AlexNet(2012)以降、ReLUが隠れ層のデフォルトに——G-319——シグモイドは「深層を育てる活性化」から「確率に写す出口」へ役割が狭まった、と歴史を一望すると理解が定着します。

G-160が列挙する活性化関数の代表——ReLU、シグモイド、tanh、ソフトマックス——は、時代と層で使い分けられた道具箱です。名前だけでなく「どの層で何のために」をセットで覚えると、G-193のような総合問題にも対応できます。

すり替えに注意

誤った説明正しい理解
出力は-1〜10〜1(G-157、TF-060)。-1〜1はtanh
シグモイド=ソフトマックス二値確率 vs 多クラス分布(G-121)
シグモイド=ReLU出力層の確率変換 vs 隠れ層の非線形(G-158)
隠れ層の第一選択現代の深層CNNではReLUが主流
シグモイド=ロジスティック回帰そのもの関数 vs 分類モデル全体(G-032)
活性化がなくても深層は十分線形の重ね合わせに近くなる(G-203)

よくある質問

シグモイド関数の出力範囲は?

0から1の範囲です。入力が大きく正でも1に近づき、大きく負でも0に近づくS字状の曲線を描きます。-1から1の範囲はtanh関数の出力であり、シグモイドの範囲ではありません(G-157)。

シグモイド関数とReLUは同じ用途ですか?

主な用途は異なります。ReLUは隠れ層で広く使われ、負の入力を0に切り捨てます。シグモイドは二値分類の出力層で確率を0〜1に写す場合や、LSTMのゲートなどで使われます。深い隠れ層の主役はReLU時代に移りました(G-158)。

シグモイド関数とソフトマックス関数は同じですか?

同じではありません。シグモイドは主に二値分類で1つの出力を0〜1の確率に変換します。ソフトマックスは多クラス分類の出力層で、複数クラスの確率を合計1の分布に変換します(G-121)。