Stable Diffusion(ステーブル・ディフュージョン)は、潜在拡散モデルに基づく生成AIの画像生成モデルです。Stability AIを中心に公開され、オープンなモデルウェイトとして広く流通しています。Midjourneyのような単一のクラウドサービスではなく、自社PCや各種アプリから動かす使い方が特徴です。本記事は全バージョンの技術解説ではなく、試験で押さえる定義(拡散モデル・Text-to-Image・オープンソース)と実務の誤解に絞って書いています。ライセンスや商用条件は2026年6月時点の情報です。利用前はコストとライセンス、公式の最新情報を確認してください。
試験で問われる見方
生成AIパスポートでは、拡散モデルが画像生成AIの代表的手法として扱われます。Stable Diffusionはその具体例として名前が挙がることがあり、Text-to-Image(テキストから画像)の文脈で覚えます。G検定でも同様に、潜在拡散やオープンな画像生成モデルとして出題されやすいです。
よくある誤解は、「Stable Diffusion=Midjourney」と同一視することです。どちらも画像を作りますが、Midjourneyはクラウドの有料サービス、Stable Diffusionはモデル+自分で選ぶ実行環境です。また「オープンソースだから何でも自由」とも限りません。ライセンス条件・商用可否・表示義務はバージョンごとに確認が必要です。
このサイトの演習で確認する
生成AIパスポート:一問一答 TF-0184(拡散モデル)、TF-0185(拡散モデルの定義)
G検定:実践演習 G-391(Text-To-Image)、一問一答 TF-478(OSSライセンス)、TF-479(OSSの誤解)
まとめて:一問一答一覧
Stable Diffusionとは
Stable Diffusionは2022年に公開された、Latent Diffusion Model(潜在拡散モデル)を用いた画像生成AIです。高解像度の画像空間ではなく低次元の潜在空間で拡散処理を行うため、比較的高速に画像を生成できます。開発・公開の中心にはStability AIがあり、研究コミュニティやクリエイターに大きな影響を与えました。
その後、SDXL(Stable Diffusion XL)など高品質・高解像度向けの派生モデルも登場しています。試験では細かいバージョン名より、「オープンな拡散モデルによる画像生成」という位置づけを押さえると十分なことが多いです。
重要なのは、Stable Diffusionがひとつのスマホアプリではない点です。モデルファイルをダウンロードし、ComfyUI・Stable Diffusion WebUI(AUTOMATIC1111)・各種クラウドサービスなど、実行環境を自分で選ぶのが一般的です。
Stable Diffusionでできること(主な機能)
モデル本体の能力と、周辺ツールで拡張される機能を整理します。
テキストから画像生成
プロンプトからイラスト・写真風・概念画などを生成します(Text-to-Image)。
画像から画像(img2img)
既存画像を元に、構図やスタイルを保ちながら別の絵に変換します。
インペインティング
画像の一部をマスクし、その領域だけを生成し直します。
LoRA・カスタムモデル
追加学習データで画風や被写体を特化。コミュニティモデルが豊富。
ローカル実行
自社PC上で完結。データを外部に送らない運用が可能(構成による)。
API・クラウド連携
Stability AIのAPIや各種ホスティング経由でクラウド利用も可能。
「オープン」とは何を指すか
試験やニュースで「オープンソースの画像AI」と言われるとき、多くはモデルウェイトやコードが公開されていることを指します。ただしライセンスには商用制限や禁止用途が含まれる場合があり、OSSの誤解のように「完全自由」とは限りません。実務では利用するバージョンのライセンス文書を必ず読みます。
コスト・ライセンス
Stable Diffusionは「月額○ドル」の単一プランではなく、モデル・環境・商用条件の組み合わせでコストが決まります(2026年6月時点)。
モデルウェイト
無料枠あり
バージョンでライセンス異なる
ローカル実行
GPU等
初期構築に手間
クラウドAPI
従量課金
Stability AI等
商用利用
要確認
ライセンス・規約を個別確認
| 利用形態 | コストの考え方 | 注意点 |
|---|---|---|
| 自社PC(ローカル) | モデルは無料のことが多い。GPU・電力・運用工数が実コスト。 | セットアップ難易度が高い |
| クラウドGPU | 時間課金。環境構築は楽になることも。 | データの社外送信に注意 |
| Stability AI API | 生成ごとの従量課金。 | 利用規約・商用条件を確認 |
| コミュニティモデル | 無料〜寄付。品質は様々。 | ライセンス・学習データが不明瞭な場合あり |
商用前は、利用するモデルバージョンのライセンスとStability AIの公式説明を確認してください。
はじめ方・基本的な使い方
個人で試す代表的な流れです。詳細は選ぶツールによって大きく異なります。
- 実行環境を選ぶ ローカル(GPU搭載PC)か、クラウドサービスかを決めます。
- UIツールを導入する ComfyUI、Stable Diffusion WebUIなど、公式・コミュニティのフロントエンドをセットアップします。
- モデルをダウンロードする 用途に合ったベースモデル(SDXL等)を入手します。
- プロンプトを入力して生成 例:「minimalist coffee shop logo, flat design, white background」
- 商用・社内利用はライセンス確認 バージョンと追加モデルごとに条件が異なります。
ビジネスでの活用例
社内ガイドライン・ライセンス・生成物の権利確認が前提です。
社内検証・PoC
- オンプレで画像生成を試す
- 機密データを外に出さない検証
- 大量バッチ生成の自動化
デザイン・ゲーム
- コンセプトアートの探索
- テクスチャ・背景のたたき台
- LoRAでキャラクター統一
開発・研究
- 拡散モデルの学習題材
- ファインチューニングの実験
- API連携プロトタイプ
試験対策
- 拡散モデル・Text-to-Imageの理解
- オープンソースとライセンスの復習
- 他画像AIとの比較整理
メリット・デメリット
| メリット | デメリット |
|---|---|
| ローカル実行でデータを社内に閉じやすい | セットアップ・GPU要件が重い |
| モデル・画風のカスタム自由度が高い | 品質は設定とスキルに依存 |
| 試験で拡散モデルの代表例 | 単一の公式UIがなく迷いやすい |
| コミュニティのノウハウ・モデルが豊富 | ライセンス確認が複雑 |
| クラウドサービス不要でコストを抑えられる場合も | 初心者にはDALL·E等の方が手軽 |
Midjourney・DALL·Eとの比較
主要な画像生成とのざっくりした違いです。
| 比較項目 | |||
|---|---|---|---|
| 性質 | オープンなモデル | クラウドサービス | OpenAIのモデル |
| 主な入口 | 各種UI・API・ローカル | midjourney.com | ChatGPT・API |
| ローカル実行 | ◎ | × | × |
| 手軽さ | △ | ○ | ◎ |
| カスタム性 | ◎ | △ | △ |
| 試験での出方 | 拡散モデル・OSS | 画像生成AIの代表 | Text-to-Imageの例 |
手軽に試すならDALL·E(ChatGPT経由)、画質探索ならMidjourney、自社環境でカスタムするならStable Diffusion、という使い分けが現実的です。
こんな人におすすめ
- GPU環境があり、ローカルで画像生成を試したい方
- 拡散モデル・オープンソースの論点を試験用に押さえたい受験生
- 独自LoRAや社内モデルで画風を統一したいチーム
- データを外部クラウドに送りたくない検証プロジェクト
あえて向いていないのは、すぐに高品質な結果だけ欲しい初心者(ChatGPTやMidjourneyの方が手軽)や、IT運用リソースが限られた現場です。
よくある質問
Stable Diffusionは無料で使えますか?
多くのモデルウェイトは無料で入手できますが、ローカル実行にはGPUなどの環境コストがかかります。クラウドサービス経由なら従量課金になることもあります。またライセンスはバージョンごとに異なるため、商用前に必ず確認してください。
Stable DiffusionとMidjourneyの違いは何ですか?
Stable Diffusionはオープンな画像生成モデルで、ローカルPCや各種アプリから使われることが多いです。Midjourneyはクラウドの有料サービスとして完結します。どちらもText-to-Imageですが、提供形態が大きく異なります。
Stable Diffusionは何社が提供していますか?
Stability AI(スタビリティ・エーアイ)が中心となって開発・公開したモデルとして知られます。ただし実際の利用は、ComfyUIや各種アプリなど多様なソフト経由で行われ、単一の公式アプリだけに限定されません。
Stable DiffusionはローカルPCで動かせますか?
はい。GPUを搭載したPCにモデルを導入し、ローカルで画像生成する使い方が一般的です。社内の機密データを外に出さずに試せる点がメリットとして挙げられることがあります。ただしセットアップとハード要件の負担は大きめです。
Stable Diffusionは拡散モデルの例として正しいですか?
はい。潜在拡散(Latent Diffusion)に基づく画像生成モデルとして、拡散モデルの代表例のひとつです。試験では「拡散モデル=SNSの拡散人数」など別分野の用語と混同しないよう注意してください。