Stable Diffusionの使い方!誰でも簡単【画像で解説】

【画像あり】Stable Diffusionの使い方!誰でも簡単

Stable Diffusionの簡単な使い方を知りたい!と考えている方は多いのではないでしょうか?

この記事では、Stable Diffusionでできることとその使い方を簡単にわかりやすく説明していきます。

リリース記念、2,000Ptプレゼント!

目次

Stable Diffusionとは

画像生成AIのイメージ

Stable Diffusion(ステーブルディフュージョン)とは、イギリスのスタートアップ企業であるStability AIが2022年8月に公開した画像生成AIです。

Stable Diffusionは、テキスト入力をもとに高品質な画像を生成することができたり、ユーザーが指定した内容やスタイルの画像を作成したりすることができます。

Stable Diffusionのメリット

未来を感じさせる見出し画像

数ある画像生成AIの中でも、特に有名な「Stable Diffusion」を使用するメリットを紹介していきます。

無料で利用できる

Stable Diffusionの一番のメリットは誰でも無料で利用できるところです。

Stable Diffusionは会員登録の必要もなくパソコンにインストールするだけで、使い方も簡単です。

商用利用が可能である

Stable Diffusionは公式規約で商用利用が許可されています。

例えば、生成された画像を商品のデザインに使用したり、CMにAIタレントを起用したりしている企業もあります。

AIを積極的に活用することによって企業価値を高めることにも繋がります。

カスタマイズ自由度の高さ

Stable Diffusionの大きなメリットの1つは、カスタマイズの自由度が高いことです。

Stable Diffusionは「オープンソース」というルールで公開されており、誰でも自由にプログラムを使ったり改良したりできます。

これによって、既存のサービスとの連携や新しい機能の追加も自由にでき、高性能な画像生成AIを用いてオリジナルのサービス開発といった使い方が可能です。

例えば、「Dream Studio」や「AIピカソ」などのサービスが、Stable Diffusionを活用しています。

Stable Diffusionでできること

画像生成AIのイメージ

Stable Diffusionにはいくつかの使い方があります。

ここからは、Stable Diffusionの主な機能を初心者向けに詳しく紹介していきます。

まだStable Diffusionをインストールしていない方は、こちらの記事でインストール方法を詳しく紹介していますので、ご覧ください。

テキストから画像を作成

まずはテキスト(文字)から画像を生成する使い方を紹介します。

テキストから画像を生成することは「txt2img」と呼ばれています。

今回はラーメンの画像を生成したいと思います。

※画像はタップすると拡大表示できます。

STEP
Stable Diffusionを起動する

まずは、Stable Diffusionを起動します。

STEP
テキスト欄に「ramen」と入力

Stable Diffusionは日本語入力ができないので「ramen」と英語でテキスト欄に入力し、生成ボタンを押します。

ここで入力するテキストを「プロンプト」と呼びます。

プロンプトは、生成される画像の内容やスタイルを指定するための指示文です。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)
STEP
青いバーが100%になるまで待つ

生成ボタンを押すと、進行状況を示す青いバーが表示されます。

この青いバーが100%になるまで待ちます。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

100%になるまでの時間はパソコンのスペックによって異なります。

STEP
完成!

青いバーが100%になると、ラーメンの画像が生成されます。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

次に少し高度な画像生成の使い方を紹介します。

テキスト(プロンプト)を追加することで、より複雑な画像を生成するという使い方ができます。

プロンプトを追加する際は、それぞれの単語をカンマ「,」で区切ります。

例えば、「sketch」と「outside」というプロンプトを加えて、スケッチ風に屋外の背景をイメージしたラーメンの画像を生成する使い方をしてみましょう。

そのためには、テキスト欄に「ramen,sketch,outside」と入力します。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

コマンド通りの画像が生成されました!

raamen

このように、Stable Diffusionでの画像生成にはプロンプトの使い方を熟知することが大切になります。

プロンプトの使い方次第で、さまざまなスタイルやテーマの画像を生成することが可能です。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

出来上がった画像の下には6つのアイコンが表示されています。

アイコン詳細
  • フォルダ…保存先のフォルダを開きます。
  • フロッピーディスク…生成された画像を保存します。
  • ボックス…生成された画像をzip形式で圧縮して保存します。
  • 額の絵…生成された画像をimg2imgのベース画像として送ります。
  • ペイント…生成された画像をペイント加工(Inpainting機能)します。
  • 三角定規…生成された画像に高度な処理を加えます。

画像から画像を作成

次は入力画像から新しい画像を生成する「img2img」の使い方について解説していきます。

img2imgは、「Image to Image」の略で画像をアップロードすることで新しいAI画像を生成する機能です。

この機能の使い方を知ると、元の画像をベースに新しいAI画像を生成できます。

たとえば、実際の写真をアップロードして、それをアニメ風や絵画風に変換することが可能です。

写真をアニメ風に変換!

さくらの写真
元の写真
さくらのAI画像
変換後の画像

では、さっそく「img2img」の使い方を紹介します。

STEP
画像をアップロード

「img2img」にタブを切り替えて、画像をアップロードします。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)
STEP
プロンプトを入力して生成

プロンプトテキスト入力欄に「best quality, sakura, temple, anime」と入力し、ネガティブプロンプト欄に「worst quality, low quality」と入力して、生成を開始します。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

「sakura, temple, anime」がメインの描写部分で、残りはノイズを取り除いたり品質を向上させたりするためのプロンプトになります。

プロンプトに関する詳細な使い方は中級者向けの記事で行います。

ネガティブプロンプトとは、生成する画像に入れたくない要素のことです。
今回は、生成画像のクオリティを上げるようなプロンプトを入れています。

STEP
完成!

元画像をベースとしたアニメ調の絵が生成できました。

画像の編集

半分のイメージの見出し画像

Stable Diffusionに、生成された画像をさまざまな方法で編集する使い方もあります。

その中で「inpaint」という機能を使うと、画像の一部分だけを変更することが可能です。

例えば、洋服のデザインを変えたり、空の雰囲気を選んで変更したりことができます。

このStable Diffusionのinpaint機能を利用すれば、画像を一から作り直す必要がなくなるので、時間の節約になります。

inpaintには主に5つの機能があり、各パラメータを調整する事によってサイズを変更したり、画像にアレンジを加えたりする使い方ができます。

5つの機能
  • マスクのぼかし:境界部分のぼやけを設定します。
  • inpaintを行う領域:塗りつぶした部分を修正します。
  • サンプリング方法:画像の生成方法とクオリティを選択します。
  • Resize to:生成する画像サイズを変更します。
  • ノイズ除去強度:元画像のアレンジ精度を変更します。低ければ元画像に近い画像が生成されます。

実際の使い方に関する説明は中級者向けの記事で詳しく説明します。

動画作成

動画生成AIのイメージ見出し画像

Stable Diffusionは、拡張機能「mov2mov」を利用することで動画を作成するという使い方もできます。

「mov2mov」での動画生成のプロセスは次の3段階に分かれています。

  • 元となる動画を学習させる AIが動画の特徴を学習
  • 動画からAI画像を生成する 学習した内容をもとに、新しいAI画像を生成
  • 生成されたAI画像から動画を生成する AI画像を連結して新しい動画を生成

生成した動画はStable Diffusionの規約と異なり、商用利用に著作権や肖像権が発生する場合があるので注意しましょう。

Stable Diffusionにmov2movを導入する方法は中級者向けの記事で詳しく説明します。

Stable Diffusionの使い方

使い方イメージの見出し画像

Stable Diffusionは、これベースとしたサービスやアプリが多く開発されているため、パソコンやスマホで簡単に使うことができます。

ここからはオンラインとパソコンにダウンロードして使うローカルの両方でStable Diffusionの使い方を紹介します。

オンラインで利用する

Stable Diffusionをオンラインで利用する場合は、ウェブで展開されているサービスを利用します。

数ある中で特に初心者に利用しやすいサービスを3つ紹介します。

PICSOROBAN

PICSOROBANトップ

PICSOROBANは、インストールの必要なくブラウザで簡単にStable Diffusionを利用できます。

さらに、今ならリリースキャンペーンとして無料会員登録するだけで、2,000ポイント(約2時間分)貰えます!

詳しい使い方は下記の記事で紹介しています。

公式サイト
PICSOROBAN

Stable Diffusionオンライン

Stable Diffusionオンラインは、トップページの文字入力欄に生成したい画像を入力するとその場で画像を生成してくれる無料体験デモツールです。

応用する機能は一切なく実用性は低いので、あくまで試用に留めておきましょう。

公式サイト
Stable Diffusionオンライン

Mage.space

Mage.spaceは、基本無料で誰でも利用することができる画像生成AIです。

ネガティブプロンプトを始めとする細かい設定にも対応しているので、Stable Diffusionの基本的な操作や仕組みを簡単に体験できます。

有料プランでは作風を変更できる様々な学習済みモデルを利用することができます。

公式サイト
Mage.space(スマホ利用可)

Dream by WoMBO

Dream by WoMBOは、基本無料で気軽に利用することができるイラスト生成AIアプリです。

生成、保存、コミュニティでの公開まで、アプリ内の簡単操作で行えるようになっています。

精度は高くありませんが、日本語での単語入力を受け付けているので不便なく使えます。

公式サイト
Dream by WoMBO (Android /iOSアプリで利用可)

ローカルで利用する

Stable Diffusionをローカル環境で利用する場合は、Stable Diffusion Web UI(AUTOMATIC1111)を自分のパソコンにインストールします。

専門的な技術は必要なく、利用料も無料です。

拡張機能やモデルとなる素材も日々増え続けていて、使い方次第で大きな可能性を持っています。

Stable Diffusion Web UI(AUTOMATIC1111)のダウンロード方法は、下記の記事で詳しくまとめています。

Stable Diffusionを使うならPICSOROBANがおすすめ

Stable Diffusionを快適に使用するには、高性能なパソコンが必須ですが、自分で高額なPCを用意するのは難しいという場合におすすめなのがPICSOROBANの利用です。

PICSOROBANを使えばいつでもStable Diffusionの性能を引き出すことができるので、理想の環境を実現できます。

ブラウザで簡単!ピクソロ!
PICSOROBANトップ

PICSOROBANは、インストールの必要なくブラウザで簡単にStable Diffusionを利用できます。

さらに、今ならリリースキャンペーンとして無料会員登録するだけで、2,000ポイント貰えます!

詳しい使い方は下記の記事で紹介しています。

\約2時間無料で使える!/

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUBロゴ

メールマガジン登録

Stable Diffusion・LLM・RAGに関する最新情報をいち早くお届けします。

無料メルマガの配信をご希望の方は、下記フォームよりご登録ください。

    EdgeHUB編集部からのお知らせ

    無料ウェビナーのお知らせ

    RAG進化のさらに先へ!自立型AIエージェント ウェビナー【12/25無料開催】

    RAG進化のさらに先へ! 大好評につきRAGシリーズ第3弾が開催決定!

    開催日時:
    2024年12月25日(水) 14:00~15:00

    内容:

    • RAGの精度を向上させる「自律型AIエージェント」のデモ
    • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

    このウェビナーでは、オープンソース「LangGraph」で構築したAIエージェントの使い方や、デモを紹介します。

    生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

    こんな方におすすめ!

    • 自律型AIエージェントに興味がある方
    • RAGの高度化を検討しているエンジニアや開発者
    • 日本語のローカルLLMの利用を検討している方
    • GPUリソースに課題を感じている方

    \簡単1分で申し込み!/

    この記事を書いた人

    EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

    目次