【画像あり】Stable Diffusionの使い方を初心者向けに解説!

【画像あり】Stable Diffusionの使い方を初心者向けに解説!

Stable Diffusionを使ってみたい!最近話題のAIを使っての画像生成ですが、何から始めていいのか分からない人や英語表記の多い海外発のサービスを利用するのにとまどったりする人は多いのではないでしょうか。

この記事では、画像生成AIサービスの中で最もメジャーであるStable Diffusionの特徴や使い方、生成例などを初心者向けにまとめて解説していきます。

目次

Stable Diffusionとは?

画像生成AIのイメージ

Stable Diffusion(ステーブル・ディフュージョン)は2022年8月にリリースされたAI技術を利用して画像を生成するオープンソースの画像生成AIサービスです。

Stable Diffusionは、ソースコードや学習済みの機械学習モデルが無償で公開されているので、それを利用したサービスやアプリも多くリリースされています。

入力したテキスト(プロンプト)情報を元に簡単にクオリティの高い画像を作ることができ、商用利用することも可能です。

Stable Diffusionの導入方法

画像生成AIのイメージ

Stable Diffusionの導入方法は、大きく2種類あります。

ここでは、Webブラウザで利用する場合とローカル環境を構築して利用する場合に分けて説明していきます。

WEB版Stable Diffusion「Dreamstudio」

WebブラウザでStable Diffusionを利用する場合はいくつかのサービスサイトから選ぶことになります。

今回は、「Dreamstudio」を利用します。

「Dreamstudio」とは、Stable Diffusionの開発元であるStability AI社が公開している公式ウェブアプリです。

パソコンのスペックに関係なくStable Diffusionの画像生成機能を利用することができます。

Dream Studioはアドレスの登録、またはGoogleアカウント連携を開始したあとに利用可能となり、無料クレジット付与分を使い切った後は従量課金が必要となります。

Dreamstudio利用方法

STEP
サイトにアクセス

まずはサイトにアクセスします。

STEP
「Get started」をクリック

右上の「Get started」ボタンをクリックして進みます。

Dream Studio
(出典:dreamstudio.ai)
STEP
アカウントの登録

右上の「Login」ボタンをクリックしてアカウントの登録を行います。

Dream Studio
(出典:dreamstudio.ai)
STEP
クレジットの付与を確認

トップページに戻り、クレジットが付与されているのを確認します。

Dream Studio
(出典:dreamstudio.ai)

サイトは英語表記なのでブラウザ機能の日本語ページで表示すると分かりやすくなります。

ローカル版Stable Diffusion

ローカル版Stable Diffusionとは、Stable Diffusionの機能リソースを自分のPC環境にダウンロードして画像生成機能を利用することを意味します。

今回は、Stable DiffusionのWeb UIで一番使いやすい「AUTOMATIC 1111」の設定方法をご紹介します。

推奨環境の確認

まずはPCの推奨環境を確認します。

条件を満たしていない場合はStable Diffusionがマニュアル通りに安定しないことがあるので注意しましょう。

PC/OSデスクトップ型 Windows10-11(64bit)
CPUIntelCore i5~Core i7、AMD Ryzen 5~7
GPURTXシリーズのVRAM 12GB以上
メモリ16GB~32GB
ストレージ512GB以上

Macにインストールする方法はこちらをチェック

Pythonのインストール

Python(パイソン)とはStable Diffusionの起動に必要なプログラム言語のパッケージです。

Stable Diffusionの起動に必要なPythonのバージョンは「3.10.6」と決まっていますので、3.10.6以外のバージョンが既にPCに入っている場合は、削除してからインストールしましょう。

STEP
Python公式サイトにアクセス

まずはサイトにアクセスし、「Downloads」ボタンからWindowsを選択します。

Python
(出典:python.org)
STEP
バージョン「3.10.6」をダウンロード

次に、Pythonバージョン「3.10.6」を選択してダウンロードします。

Python
(出典:python.org)
STEP
Pythonをインストール

インストーラーを開き「Add Python 3.10 to PATH」にチェックを入れて進めます。

Python
(出典:python.org)

Gitのインストール

Gitとは、プログラムのファイルを管理するシステムで、Stable Diffusionにも必要です。

サイトからダウンロードしたインストーラーを開き、「Next」ボタンをクリックして進めていきます。

github
(出典:git-scm.com)

チェックボックスやオプションは特に追加する必要はありません。

Stable Diffusion Web UI(AUTOMATIC1111)のダウンロード

STEP
Stable Diffusion Web UIを格納するフォルダを作成

Stable Diffusion Web UIを格納するフォルダを作成します。

フォルダ名が長いとエラーが起きてしまう場合があるので、Cドライブ直下に今回はフォルダ名「SD」で作成します。

AUTOMATIC1111
STEP
コマンド入力画面を開く

「SD」フォルダを開き、フォルダ内で右クリックして「Open Git Bash here」を選択します。

AUTOMATIC1111

すると次のような「コマンド入力画面」が出てきます。

AUTOMATIC1111
STEP
コマンドを入力

コマンド入力画面で「$」が表示されている行に下記のコマンドを入力します。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
AUTOMATIC1111

コマンド入力後、SDフォルダの中に「stable-diffusion-webui」のフォルダが作成されていることを確認します。

STEP
コマンドの書き換え(推奨環境以外の場合)

※ステップ4は「推奨環境」が揃っていない場合のみ実行してください。

推奨環境が揃っている場合は、ここを飛ばして「ステップ5」へ進んでください。

「stable-diffusion-webui」フォルダ内の「webui-user.bat」を右クリックし、「編集」を選択してメモ帳で開き、編集します。

※メモ帳が開いている状態で「webui-user.bat」をドラッグ&ドロップすることでも編集できます。

Stable Diffusion Web UI(AUTOMATIC1111)

▼GPUを持っているが、メモリが4GB以下の場合

6行目にある「set COMMANDLINE_ARGS=」を下記に書き換え「上書き保存」します。

set COMMANDLINE_ARGS=--skip-torch-cuda-test


▼GPUを持っていない場合(非推奨)

6行目にある「set COMMANDLINE_ARGS=」を下記に書き換え「上書き保存」します。

set COMMANDLINE_ARGS=--skip-torch-cuda-test --upcast-sampling --no-half-vae --use-cpu interrogate --precision full --no-half

※こちらのコマンドは本来GPUで処理する計算をCPUに振り分ける内容です。
CPUに大きな負荷がかかったり、本来のパフォーマンスで生成される画像が生成されない場合があります。
利用の際は自己責任にてお願い致します。

書き換え後

Stable Diffusion Web UI(AUTOMATIC1111)
STEP
ダウンロード開始

webui-user.bat」をダブルクリックして、Stable Diffusion Web UIのダウンロード&インストールを開始します。

ダウンロードは数10分から1時間ほどかかりますので、気長に待ちましょう。

Stable Diffusion Web UI(AUTOMATIC1111)

Running on local URL:~」が表示されればインストール完了です。

STEP
Stable Diffusion Web UIを起動

ダウンロードが終了したら黒い画面を閉じて「webui-user.bat」をダブルクリックすると「Stable Diffusion Web UI」が立ち上がります。

Stable Diffusion Web UI(AUTOMATIC1111)
(出典:Stable Diffusion Web UI)

スポンサーリンク

Stable Diffusionの使い方

それでは実際にStable Diffusion Web UI(AUTOMATIC1111)を使って画像を生成してみます。

今回は「忍者」の画像を生成したいと思います。

Stable Diffusionは日本語の入力は受け付けていないので、「ninja」と打ち込み生成ボタンをクリックします。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

ゲージが100%になるまで待ちます。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

書き出された画像はフロッピーディスクのアイコンをクリックして保存することが出来ます。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

保存した画像は下記の場所に格納されます。

C:\SD\stable-diffusion-webui\outputs\txt2img-images\保存した日の日付

スペックの低いパソコンだとこの画像生成に30分以上かかることもあります。

Stable Diffusionのプロンプト日本語化拡張機能

Stable Diffusion Web UIを日本語化する方法を紹介します。

そのまま利用する場合は英語でのナビゲーションで分かりづらいので、日本語化しておきましょう。

STEP
Availableタブを開く

Stable Diffusion Web UI内「Extensions」の「Available」タブに切り替えます。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)
STEP
localizationのチェックを外す

「Available」タブ内の「localization」のチェックを外し「Load from」ボタンをクリックします。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)
STEP
「ja_JP Localization」をインストール

表示された拡張機能一覧の中から「ja_JP Localization」をインストールしましょう。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)
STEP
日本語設定を保存する

「Settings」タブから「User interface」をクリックし、画面上部にある「Localization(requires Reload UI)」から「ja_JP」を選択します。

その後、「Apply settings」をクリックして保存し、「Reload UI」でStable Diffusionを再起動すれば完了です。

※タブの中が空白の場合は、すぐ右にある青い更新ボタンをクリックします。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)
STEP
日本語化完了!

再起動後、Stable Diffusion Web UIが日本語になっていることを確認します。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

Stable Diffusionのような画像生成AIにはクラウドGPUがおすすめ

推奨環境を見ていただくとおわかりのように、Stable Diffusion Web UI(AUTOMATIC1111)をスムーズに利用するには、高スペックなパソコンが必要です。

ただし、Stable Diffusionを快適に利用できるような高性能なパソコンは、ほとんどが30万円以上と高額になります。

コストを抑えたい方へ:クラウドGPUの利用がおすすめ

クラウドGPUとは、インターネット上で高性能なパソコンを借りることができるサービスです。これにより、最新の高性能GPUを手軽に利用することができます。

クラウドGPUのメリット

  • コスト削減:高額なGPUを購入する必要がなく、使った分だけ支払い
  • 高性能:最新の高性能GPUを利用できるため、高品質な画像生成が可能
  • 柔軟性:必要なときに必要なだけ使えるので便利

こんな人におすすめ

  • 少ない予算でStable Diffusionを快適に使いたい
  • 自分のパソコンの性能が不足していると感じる人
  • 常に最新の高性能GPUを使いたい人

GPUSOROBAN

GPUSOROBAN

GPUSOROBANは、高性能なGPU「NVIDIA A4000 16GB」を業界最安値の1時間50円で使用することができます。

さらに、クラウドGPUを利用しない時は停止にしておくことで、停止中の料金はかかりません。

クラウドGPUを使えばいつでもStable Diffusionの性能をフルに引き出すことができるので、理想の環境に近づけることができます。

\快適に生成AI!1時間50円~/

Stable Diffusionが快適に使えるおすすめのパソコンやグラボに関しては下記の記事で紹介しています。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUB編集部からのお知らせ

無料ウェビナーのお知らせ

ソフトバンクSarashinaウェビナー

日本語LLM「Sarashina」& OCR機能「Phi-3 Vision」の 無料オンラインウェビナー!

開催日時:
2024年7月24日(水) 14:00~15:00

内容:

  • 「Sarashina」や「Phi-3 Vision」の概要と使い方の紹介
  • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

このウェビナーでは、ソフトバンクの日本語の強いの大規模言語モデル「Sarashina」の使い方や、実際にどのように使えるかを具体的に紹介します。

また、画像からテキストを抽出するOCR機能を簡単に作成できる「Phi-3 Vision」の使い方もデモを交えてお見せします。

生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

こんな方におすすめ!

  • 最新のAI技術やトレンドに興味がある方
  • AI開発に携わっている方
  • 生成AIの実用的な活用方法を学びたい方
  • 新しいツールや技術を積極的に取り入れたい方

\参加申し込みはこちら!/

この記事を書いた人

EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

目次