DALL-E 3の使い方!無料版はあるの?ChatGPTで画像生成

DALL-E 3の使い方!無料版はあるの?ChatGPTで画像生成

DALL-E 3 (dalle3)は、驚くほど簡単な使い方で画像が生成できる画像生成AIです。

この記事では、DALL-E 3の特徴や、他の画像生成AIとの違い、使い方やプロンプト例を生成画像付きで紹介します。

リリース記念、2,000Ptプレゼント!

目次

DALL-E 3とは?

見出し画像

DALL-E 3(ダリスリー/dalle3)は、OpenAI社が開発した最新の画像生成AIです。

入力テキストに基づいて画像生成を行うことができ、少しの特徴を指示するだけで驚くほど高クオリティの画像を生成できます。

DALL-E 3の概要

DALL-E 3はChatGPTやBing AIのようなチャット型AIと画像生成AIを組み合わせています。

DALL-E 3は言語処理に特化したチャット型AIと連携しているため、入力されたテキストの説明からニュアンスを読み取り画像を生成することができます。

また、入力された画像を元に新たな画像を生成する機能もあります。

DALL-Eシリーズの進化の軌跡については下記の記事で紹介しているので興味がある方はぜひご覧ください。

DALL-E 3と他の画像生成AIとの違い

DALL-E 3と有名な画像生成AIである「Stable Diffusion」や「Midjourney」との違いを表にしました。

DALL-E 3Stable DiffusionMidjourney
料金無料 or 月額20ドル無料月額10ドル
日本語××
商用利用
無料版は不可
(2024年4月時点の情報)

DALL-E 3のメリット

DALL-E 3のメリットは主に次の2点です。

  • 日本語での利用が出来る
  • 専門的な知識がなくとも高品質な画像が生成できる

DALL-E 3は、言語処理に特化したチャット型AIと連携しているので、日本語はもちろん様々な言語で画像生成の指示ができます。

テキストで指示ができるので、専門的な知識がない初心者の方でも簡単に高品質な画像を生成することができます。

DALL-E 3のデメリット

DALL-E 3のデメリットは主に次の2点です。

  • 画像の編集は難しい
  • カスタマイズ性が低い

DALL-E 3は、他の画像生成AIに比べてピンポイントでの画像編集が難しいです。

例えば手だけを変えたい場合でも、全て1から作り直されてしまいます。

また、Stable Diffusionにあるような画風を追加学習できるといった機能もありません。

DALL-E 3の使い方

DALL-E 3の使い方には次の2種類があります。

DALL-E 3の使い方
  • Bing Image Creator(Copilot)
  • ChatGPT

DALL-E 3をBing Image Creatorで使う場合は、無料で利用ができますが、生成した画像の商用利用はできません。

一方、DALL-E 3をChatGPTで使う場合は、生成した画像の商用利用はできますが、月額20ドルの「ChatGPT Plus」に加入する必要があります。

ChatGPT PlusBing Image Creator
料金月額20ドル無料
日本語対応
商用利用
公式サイトhttps://chat.openai.com/auth/loginhttps://www.bing.com/images/create
(2024年4月時点の情報)

DALL-E 3の使い方:【無料】Bing Image Creator(Copilot)

Bing Image Creator(Copilot)での使い方は、ブラウザで「bing」と検索、もしくはこちらからアクセスします。

ページが開いたら「Copilot」をクリックします。

Bing AI
(出典:bing.com)

ページ下部にある入力欄に生成したい画像をテキストで指示することで画像生成ができます。

Bing AI
(出典:bing.com)
Bing AI
(出典:bing.com)
プロンプト

「一面真っ青なネモフィラ畑と満開の桜のコラボレーション画像を描いて」

Bing Image Creatorで本格的にDALL-E 3を使用して画像生成をする場合は、こちらの画像生成に特化したページから利用するのが便利です。

Bing Image Creator
https://www.bing.com/images/create

DALL-E 3の使い方:【有料】ChatGPT

ChatGPTでDALL-E 3を使う場合は、「ChatGPT Plus」に加入したアカウントでChatGPTを開く必要があります。

無料で使えるChatGPT 3.5では、DALL-E 3による画像生成ができません。

ChatGPT4になっていることを確認してから入力欄に生成したい画像を指示するようにしましょう。

DALL-E 3
(出典:chat.openai.com)
DALL-E 3
(出典:chat.openai.com)
プロンプト

一面真っ青なネモフィラ畑と満開の桜のコラボレーション

ChatGPTでは、DALL-E 3の使い方をもっと便利にする方法があります。

GPTを探索する
(出典:chat.openai.com)
DALL-E 3
(出典:chat.openai.com)

このように「GPTを探索する」機能から「DALL-E」を選択し利用すると、一度に2枚の画像が生成できます。

DALL-E 3
(出典:chat.openai.com)

DALL-E 3プロンプトの例

見出し画像

DALL-E 3で画像を生成する場合、自身の持つイメージと近づけるためには具体的な指示を与える必要があります。

指示を行うテキストのことをプロンプトと呼びます。

この章では、いくつかのプロンプト例を紹介していきます。

イメージを具体的に伝えるプロンプト

DALL-E 3に、生成したい画像のイメージを具体的に伝えます。

今回は「カピバラ」を生成する例で考えていきます。

カピバラ
プロンプト

「カピバラ」

このように、ただ単に「カピバラ」と入力してもDALL-E 3が良い感じに画像を仕上げてくれるのですが、どんなシチュエーションであるかなどを具体的に入力することで、より指示に近い画像が生成されます。

カピバラの群れが、頭に柚子をのせて温泉でくつろいでいるシチュエーションを指示してみます。

カピバラ
プロンプト

「温泉でくつろいでいる小さいカピバラの群れの写真。頭の上には柚子をのせ気持ちよさそうに目を細めくつろいでいる。そのまったりとした様子は見る人も幸せにする。」

頭の上の果物はオレンジに見えますが、おおよそ指示通り、カピバラの群れが目を細めてくつろいでいる画像が生成されました。

画風を変えるプロンプトの使い方

DALL-E 3では、さまざまな画風で画像を生成するという使い方もできます。

下記は主な画風の一例です。下記以外にも画風を指示すれば、DALL-E 3が再現します。

アニメ水彩画
イラスト抽象画
写真印象派

画風の使い方は、プロンプト内に指示を含めることで反映されます。

カピバラ
カピバラ
プロンプト

左:「抽象画でくつろいでいるカピバラを描いて」

右:「水彩画でくつろいでいるカピバラを描いて」

ピカソ風など著作権の関係で直接模倣できない画風もありますが、DALL-E 3が似たような画風を提案してくれる場合もあります。

タップで拡大

DALL-E 3
(出典:chat.openai.com)

画像に文字を入れるプロンプトの使い方

DALL-E 3では、生成画像に文字を入れることができますが、2024年4月現在、画像に入れられる文字は「英語のみ」となっています。

使い方は、画像に入れたい文字と配置を決めて指示するだけです。

カピバラ
プロンプト

「アメコミ風カピバラ、吹き出しには『KAPIBARA』と書かれている」

画像のサイズを指定するプロンプトの使い方

DALL-E 3では、次の3サイズで画像を生成することができます。

生成できるサイズ
  • 正方形(1024px×1024px)
  • 横長/ワイドスクリーン(1792px×1024px)
  • 縦長/縦のアスペクト(1024 px ×1792px)

デフォルトは正方形ですが、他のサイズで生成したい場合は、プロンプトに画像のサイズを含めます。

カピバラ
プロンプト

「原っぱで遊ぶカピバラの写真を横長で」

カピバラ
プロンプト

「空を見上げて雲を見ているカピバラの縦長の写真」

ChatGPT PlusでDALL-E 3を使う場合には、右下に「アスペクト比」というボタンがあるので、そこからサイズを選択することもできます。

DALL-E 3
(出典:chat.openai.com)

画像を編集するプロンプトの使い方

DALL-E 3では、プロンプトで画像の一部を編集するという使い方もできます。

画像生成直後に変更を指示する場合は、「右側の画像の○○を変更してください」といったプロンプトで編集ができます。

ただ、間に他の会話が入り画像との距離が離れてしまった場合、先ほどのような指示ができません。

その場合は、「シード値」や「画像ID(gen_id)」を使って画像の編集を指示するのがおすすめです。

簡単に説明すると2つの違いは次の通りです。

シード値画像ID
・画像生成の際の「ランダムな要素」を決める数字
同じような画像を生成したいときに使用
・生成された「画像を識別する番号
同じような要素や画風を引継ぎたいときに使用

シード値や画像IDの使い方

今回は「右の画像の頭の上の果物」を変更してみます。

DALL-E 3
(出典:chat.openai.com)

シード値や画像IDは、DALL-E 3に質問すると教えてもらえます。

プロンプト

「右の画像IDとシード値を教えてください」

シード値「2072025569」画像ID「HK6DEYQDDgcICWe3」であると返答がありました。

まずは、このシード値「2072025569」を使って「頭の上の果物」を柚子からリンゴに変更するよう指示します。

プロンプト

「シード値2072025569の頭にのせている果物を赤いリンゴにしてください」

カピバラ

全く同じ画像ではありませんが、シード値を利用するとことで、ある程度画像を維持したまま部分的に変更することができます。

次は、画像ID「HK6DEYQDDgcICWe3」を使って「頭の上の果物」を柚子からリンゴに変更するよう指示してみます。

プロンプト

「画像ID:HK6DEYQDDgcICWe3の頭にのせている果物を赤いリンゴにしてください」

カピバラ

画像IDを利用することで、画風や要素を引き継ぎ部分的に変更することができます。

構図も同じようにしたまま編集したい場合は「シード値」を利用し、画風や要素を引き継いで編集したい場合は「画像ID」を利用すると良いでしょう。

DALL-E 3で生成された画像のプロンプトを確認する

見出し画像

ChatGPTのDALL-E 3では実際に画像生成に使用されたプロンプトを確認することができます。

プロンプトは次の方法で確認できます。

  1. まずは、プロンプトを確認したい画像をクリックします。
  2. するとプロンプトが確認できます。
DALL-E 3
(出典:chat.openai.com)

DALL-E 3の便利な使い方:ChatGPTでプロンプトを作成する

閃きの見出し画像

DALL-E 3を使って画像生成する場合、ChatGPTを使ってプロンプトを作成すると便利です。

下記はChatGPTへの指示プロンプトですので、好みの条件をご自身で追加して使用してください。

ChatGPTへの指示プロンプト

### 役割 ###

あなたはAIで数々の画像を生成してきた最高のプロンプトエンジニアです。

### 指示 ###

画像のコンセプトは毎回入力するので<条件>に従ってプロンプトを作成してください。

### 条件 ###

-このチャットではプロンプトのみを出力

-DALL-E 3で生成する画像のプロンプト

-具体的かつ独創的な画像になるように考えて

実際にChatGPTを使用してプロンプトを作成した例を紹介します。

ChatGPTを使ったプロンプト作成例

入力:

「子どものカピバラが温泉でくつろいでいる。写真風。明るくキラキラしている。」

ChatGPTが想像力を働かせ、足りない部分を補完してくれます。

出力:

「子どものカピバラが温泉でくつろいでいる写真。カピバラはリラックスした表情で、温泉の暖かさを楽しんでいる。周りには湯気が立ちのぼり、温泉の心地よさを感じさせる。画像は明るくキラキラしており、温泉のぬくもりとカピバラの癒しの雰囲気を表現する。」

カピバラ

DALL-E 3の使い方を覚えて画像生成を楽しもう!

チャット型AIと連携しているDALL-E 3は会話をするように手軽に画像生成ができます。

実はDALL-E 3は、同じことを何度も頼むと嫌がることがあるのですが、こうしたところが少し人間的で面白いところでもあります。

DALL-E 3の使い方を覚えて画像生成を楽しんでくださいね。

GPUSOROBAN
https://soroban.highreso.jp/

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUBロゴ

メールマガジン登録

Stable Diffusion・LLM・RAGに関する最新情報をいち早くお届けします。

無料メルマガの配信をご希望の方は、下記フォームよりご登録ください。

    EdgeHUB編集部からのお知らせ

    無料ウェビナーのお知らせ

    RAG進化のさらに先へ!自立型AIエージェント ウェビナー【12/25無料開催】

    RAG進化のさらに先へ! 大好評につきRAGシリーズ第3弾が開催決定!

    開催日時:
    2024年12月25日(水) 14:00~15:00

    内容:

    • RAGの精度を向上させる「自律型AIエージェント」のデモ
    • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

    このウェビナーでは、オープンソース「LangGraph」で構築したAIエージェントの使い方や、デモを紹介します。

    生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

    こんな方におすすめ!

    • 自律型AIエージェントに興味がある方
    • RAGの高度化を検討しているエンジニアや開発者
    • 日本語のローカルLLMの利用を検討している方
    • GPUリソースに課題を感じている方

    \簡単1分で申し込み!/

    この記事を書いた人

    EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

    目次