DALL-E 3とは、日本語で手軽に使える画像生成AIのことです。
この記事では、DALL-E 2とDALL-E 3の違いや基本的な使い方などを紹介します。
DALL-E 3とは?

DALL-E 3は、アメリカの企業であるOpenAIが開発した画像生成AIです。
画像生成AIとは、テキストから画像を生成できる技術を持っており、例えば「満開の桜と青空」といった具体的なイメージをテキストで入力すると、それに沿った画像を生成します。
DALL-E 3に関する詳しい内容は、このあと説明していきますが、先に画像生成AIについて知りたいという方は、こちらの記事もご覧ください。

DALL-E 3の読み方
DALL-E 3の読み方は「ダリ スリー」です。
「DALL-E」の由来は、スペインの画家「サルバドール・ダリ」と映画「WALL-E(ウォーリー)」からきているそうです。
独創的な画家と人間のようなロボット「ウォーリー」を由来としているDALL-E 3は、まさに人間の創造性とAI技術の融合を象徴するものと言えるでしょう。
DALL-E 3への進化の軌跡

DALL-E(初代)は2021年1月にOpenAI社による公式ブログで発表されました。
後継であるDALL-E2は、2022年4月に発表され、9月に一般公開されました。
その翌年の2023年9月21日にはDALL-E2の後継であるDALL-E3が発表されました。
DALL-E 2に比べDALL-E 3で進化したのは主に次のような点です。
- 言語の理解能力が向上
- 著作権に配慮・安全性の向上
- 縦長や横長の画像を生成できる
これらについて具体的に説明していきます。
言語の理解能力が向上
DALL-E 3では、言語の理解能力が向上しています。
次の具体例をOpenAI社が発表しています。
“An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.”
DALL-E 3 公式サイトより
( 爆発する星雲のように描かれた、バスケットボール選手がダンクする様子を表現豊かに描いた油絵。)

生成結果を見てみると、DALL-E 2(左)ではダンクしているとは感じられない画像が生成されてしまいますが、DALL-E 3(右)ではダンクするバスケットボール選手を正しく理解して生成しています。
著作権に配慮・安全性の向上
DALL-E 3では、著作権への配慮や安全性が向上しています。
フェイクニュースに利用されないように、実在する人物の生成を拒否し、著作権に配慮してアニメキャラクターなどの生成も拒否します。
また、安心して利用できるように暴力的な画像や成人向けの画像が生成されないような配慮もされています。
縦長や横長の画像を生成できる
DALL-E 2では生成できる最大画像サイズは1024px×1024px(正方形)でした。
DALL-E 3では、正方形(1024px×1024px)に加え横長(1792px×1024px)や縦長(1024 px ×1792px)の画像を生成できるようになりました。

スポンサーリンク
DALL-E 3の特徴・商用利用は可能?

DALL-E 3は、難しい設定が必要なく、生成したいイメージをテキストで入力するだけで画像生成ができます。
これまでのバージョンに比べDALL-E 3は、言語処理能力が上昇していることで入力したテキストに忠実な画像が生成できるようになっています。
また、DALL-E 3はChatGPTやBing AIのようなチャット型AIと連携しているので、日本語による指示も可能です。
Bing Image CreatorではDALL-E 3を無料で利用できますが、生成した画像は商用利用ができません。
一方、ChatGPTの有料プラン「ChatGPT Plus」に登録してDALL-E 3で生成した画像は、商用利用が可能です。
ChatGPT Plus | Bing Image Creator | |
---|---|---|
料金 | 月額20ドル | 無料 |
日本語対応 | ||
商用利用 | ||
公式サイト | https://chat.openai.com/auth/login | https://www.bing.com/images/create |
DALL-E 3を使うには、Bing Image CreatorやChatGPT plusが必要となりますが、詳しい使い方については次の章で説明します。

DALL-E 3の使い方

DALL-E 3はChatGPTかBing AIで利用することができます。
Bing AIでは無料で利用ができますが、ChatGPTで利用する場合は、月額20ドルの「ChatGPT Plus」に登録が必要です。
どちらで利用する場合でも日本語で利用可能です。
Bing Image CreatorでDALL-E 3を利用する
ブラウザで「bing」と検索、もしくはこちらからアクセスします。
開いたら「Copilot」をクリックします。

「Copilot」を開いたらページ下部にある入力欄に生成したい画像をテキストで指示します。

今回は次の指示で画像を生成します。
「ジャンガリアンハムスターブルーサファイアとキンクマが楽しそうに走っているイラストを描いて」

Copilotが日本語の指示を理解して、DALL-E 3で画像を生成しました。
「キンクマ」は全身がクリーム色のゴールデンハムスターの日本での呼び名です。
一部に熊も生成されていますが、基本的にはゴールデンハムスターが生成されています。
ChatGPTでDALL-E 3を利用する
ChatGPTでDALL-E 3を利用する場合、有料プラン「ChatGPT Plus」の加入が必要になります。
まず、ChatGPT Plusに加入したアカウントでChatGPTを開きます。
ChatGPT4になっていることを確認して入力欄に生成したい画像を指示します。

今回は次の指示で画像を生成します。
「ジャンガリアンハムスターブルーサファイアとキンクマが楽しそうに走っているイラストを描いて」

こちらも日本語の指示を理解して、画像を生成しました。
「キンクマ」は全身がクリーム色のゴールデンハムスターの日本での呼び名ですが、その意味を理解してきちんとハムスターを描いています。
DALL-E 3 に細かく指示を出す
生成画像を思い描くイメージに近付けるためには、DALL-E 3に具体的な指示を出す必要があります。
例えば、横長の画像、背景にひまわり、キンクマをクリーム色の毛に近付けるよう指示します。
「ジャンガリアンハムスターのブルーサファイアとクリーム色のゴールデンハムスター(キンクマ)が、背景に広がるひまわり畑で楽しそうに走っているイラスト。ブルーサファイアは美しい青みがかった毛色で、キンクマは柔らかなクリーム色の毛並みをしている。二匹は元気いっぱいにひまわり畑を駆け回り、その姿は見る人をも幸せな気持ちにさせる。ひまわりは太陽に向かって大きく咲き誇り、ハムスターたちの動きと楽しさを引き立てる。画像は横長で、ハムスターたちとひまわり畑の明るく楽しい雰囲気を捉える。」

このように、具体的なイメージをDALL-E 3に指示することで、生成画像を自身の描いたイメージに近づけることができます。
DALL-E 3を使えば、絵のタッチも簡単に変更することもできます。
例えば、「アニメ風にしてください」や「水彩画風にしてください」などと指示すると、DALL-E 3が画風を変えて画像を生成してくれます。


下記の記事では様々なプロンプトの例を紹介しています。

DALL-E 3で画像生成を楽しもう!
DALL-E 3は日本語で指示ができるので、誰もが手軽に画像生成できますね。
DALL-E 3を使ってみたい場合は、まずは無料で使えるBing AIから試してみるのがおすすすめです。