DALL·E(ダルイー)は、OpenAIが開発する生成AIの画像生成モデルです。テキストの説明(プロンプト)からイラストや写真風の画像を作るText-to-Image(テキストto画像)の代表例として、資格試験でも名前が挙がります。一般ユーザーはChatGPTの画面から「猫のイラストを作って」と指示する形で触れることが多く、チャットの会話の流れの中で画像が返ってくるのが特徴です。本記事は全バージョンの技術史ではなく、試験で押さえる定義(OpenAI製・Text-to-Image・ChatGPTとの関係)と実務の誤解に絞って書いています。料金・利用枠は2026年6月時点の情報です。利用前は料金の整理と公式の最新情報を確認してください。
試験で問われる見方
G検定では、Text-to-Imageの説明としてDALL·Eが例に挙がることがあります。「テキストから画像を生成する」タスクであり、拡散モデル(Diffusion Model)やマルチモーダルAIの文脈とセットで出題されます。生成AIパスポートでも、ChatGPTの機能として画像生成に触れる章があり、チャットAIと画像生成の関係を理解しておくとよいです。
よくある誤解は、「DALL·E=ChatGPT」と同一視することです。ChatGPTは対話サービス、DALL·Eは画像を作るモデル(機能)の名前です。また「DALL·Eは音声処理の技術」のような選択肢は不正解です。MFCCなど音声特徴量と混同しないよう、入出力がテキスト→画像である点を押さえます。
このサイトの演習で確認する
G検定:実践演習 G-391(Text-To-Image)、G-394(DALL-E)、一問一答 TF-170(生成AI)
生成AIパスポート:一問一答 TF-0115(ChatGPT)
まとめて:G検定 実践演習一覧 · 生成AIパスポート 一問一答一覧
DALL·Eとは
DALL·Eは、2021年にOpenAIが発表した画像生成モデル系列の名称です。名前は画家のダリ(Dalí)とロボット映画WALL·Eを掛け合わせた造語と言われます。DALL·E 2、DALL·E 3と世代が進み、2026年時点ではChatGPTやAPI経由で使われるのは主にDALL·E 3です。
技術的には拡散モデルを用いたText-to-Imageが中心です。ユーザーが自然言語で「夕焼けの富士山、水彩画風」と書くと、その内容に沿った画像が生成されます。ChatGPTと統合されているため、会話で要件を詰めながら画像を直す使い方がしやすいのが特徴です。
試験では、「OpenAIが提供する画像生成」と「Text-to-Imageの事例」の2点をセットで覚えると十分なことが多いです。ChatGPTと開発元が同じである点も重要です。
DALL·Eでできること(主な機能)
DALL·E単体の能力と、ChatGPT経由で使うときの体験を整理します。
テキストから画像生成
プロンプトの説明から、イラスト・写真風・図解風などの画像を生成します。
会話での修正(ChatGPT連携)
「もっと明るく」「文字を入れて」など、チャットで指示を重ねて調整できます。
画像の編集・部分変更
既存画像の一部を書き換えるなど、編集系の機能(名称・範囲は変更あり)。
スタイル・構図の指定
画風、色調、被写体の配置などを自然言語で指定できます。
API連携
開発者はOpenAI APIからDALL·Eを呼び出し、アプリや業務フローに組み込めます。
コンテンツポリシー
著作権・有害コンテンツなど、OpenAIのポリシーに沿った生成制限があります。
ChatGPTとの関係
エンドユーザーが触る入口は、多くの場合ChatGPTのWebアプリです。裏側でDALL·Eが動き、表向きは「ChatGPTが画像を返した」ように見えます。試験や実務の説明では、サービス(ChatGPT)とモデル名(DALL·E)を区別して書くと誤解が減ります。
料金・利用の仕組み
DALL·E単体の月額プランというより、ChatGPTのプランやAPIの従量課金でコストが決まります(2026年6月時点)。
ChatGPT 無料
¥0
画像生成に制限あり
ChatGPT Plus 等
要確認
多めの生成・高機能
API(DALL·E 3)
従量課金
解像度ごとに単価
Enterprise
要相談
法人向け
| 利用方法 | 料金の考え方 | 向いている人 |
|---|---|---|
| ChatGPT(個人) | 無料枠+有料プラン。画像の回数・速度に差。 | まず試したい・資料用にたまに使う |
| OpenAI API | 生成1枚あたりの従量課金(サイズにより異なる)。 | アプリ開発・業務自動化 |
| 法人契約 | ChatGPT Team / Enterprise 等。データ取り扱いは別途確認。 | 社内ガイドラインのもとで使うチーム |
契約前はOpenAI DALL·E 3と料金ページで最新条件を確認してください。
はじめ方・基本的な使い方
個人で試すなら、ChatGPTから始めるのが最も簡単です。
- ChatGPTにアクセスする chatgpt.comでアカウントを作成・ログインします。
- 画像生成を依頼する 例:「白背景にシンプルなコーヒーカップのイラストを作って。フラットデザインで」
- 会話で直す 「色をもう少し暖かく」「横長のバナー向けに」など、追加指示で調整します。
- 用途に合わせて保存 ダウンロードや再利用の可否は利用規約と社内ルールを確認します。
- 業務利用はガイドラインを確認 クライアント素材や社外公開では、商用条件とクレジット表記を必ず確認します。
ビジネスでの活用例
著作権・商用利用・社内情報の入力禁止など、ガイドライン確認が前提です。
マーケ・広告
- SNS投稿用ビジュアルのたたき台
- キャンペーンコンセプトの可視化
- バナー案の素早いブレスト
資料・教育
- 説明用イラストの下書き
- 教材の図解イメージ
- 資格学習用の概念図(要確認)
プロダクト開発
- UIモックの雰囲気作り
- アイデアスケッチの共有
- API経由の画像自動生成
試験対策
- Text-to-Imageの定義理解
- OpenAI製ツールの整理
- 他画像AIとの比較
メリット・デメリット
| メリット | デメリット |
|---|---|
| ChatGPTから手軽に試せる(無料枠あり) | 生成回数・品質はプラン次第 |
| 会話で要件を詰めやすい | Midjourneyほど「芸術的」に特化はしていない |
| 試験で名前が出やすい(OpenAI・Text-to-Image) | サービス名とモデル名の混同に注意 |
| APIで業務システムに組み込める | 商用・著作権は規約と案件ごとに要確認 |
| GPTと同じ開発元で説明しやすい | ローカル完結・オフラインには不向き |
Midjourney・Stable Diffusionとの比較
主要な画像生成とのざっくりした違いです。
| 比較項目 | Stable Diffusion | ||
|---|---|---|---|
| 開発元 | OpenAI | Midjourney社 | Stability AI 等 |
| 主な入口 | ChatGPT・API | midjourney.com | 各種アプリ・ローカル |
| 無料で試す | ○(枠あり) | × | ○(環境による) |
| 会話で調整 | ◎(ChatGPT経由) | △ | △ |
| 画質・芸術性 | ○ | ◎ | ○(設定次第) |
| 試験での出方 | Text-to-Imageの例 | 画像生成AIの代表 | オープンソースの例 |
手軽さと試験対策ならDALL·E(ChatGPT経由)、本格的なビジュアル探索ならMidjourney、自前環境でのカスタムならStable Diffusion、という使い分けが現実的です。
こんな人におすすめ
- 無料〜低コストで画像生成を試したい方
- すでにChatGPTを使っており、画像も同じ画面で作りたい方
- G検定でText-to-Image・DALL·Eの問題を押さえたい受験生
- APIでアプリに画像生成を組み込みたい開発者
あえて向いていないのは、画像品質だけを最優先するプロのビジュアル制作(Midjourney等との比較検討が先)や、完全オフラインで動かしたいケースです。
よくある質問
DALL·Eは無料で使えますか?
ChatGPTの無料プランでも、一定の範囲で画像生成(DALL·E)を試せる場合があります。ただし回数や解像度には制限があり、多く使う場合は有料プランやAPIの従量課金が必要です。最新条件はOpenAI公式で確認してください。
DALL·EとChatGPTの違いは何ですか?
ChatGPTは対話型のチャットサービス、DALL·Eは画像を生成するモデル(機能)の名前です。日常ではChatGPTの画面から「画像を作って」と指示すると、裏側でDALL·Eが動く、という関係が一般的です。試験ではサービス名とモデル名を分けて覚えます。
DALL·Eは何社が提供していますか?
OpenAI(オープンエーアイ)が開発・提供する画像生成モデルです。GPTシリーズと同じ開発元である点が試験でよく問われます。
DALL·EとMidjourneyの違いは?
どちらもText-to-Imageですが、DALL·EはOpenAI製でChatGPTから手軽に使える点が強みです。Midjourneyは画像生成専用の有料サービスで、芸術的な画質に定評があるとされることが多いです。無料で試すならDALL·E、本格的なビジュアル探索ならMidjourney、という整理がよくされます。
DALL·EはText-to-Imageの例として正しいですか?
はい。テキストの説明から画像を生成するText-to-Image(テキストto画像)の代表例として、G検定などで名前が挙がることがあります。音声特徴量のMFCCなど、別分野の用語と混同しないよう注意してください。