「なぜ同じプロンプトなのに、結果が違うのだろう?」
Stable Diffusionを使い始めた多くの人が抱くこの疑問には、サンプラーとスケジュールタイプという大事な設定が関わっています。
この記事では、画像の品質や生成速度を左右するこれらの仕組みについて、初心者にも分かりやすく基本の考え方と代表的な特徴を解説します。
Stable Diffusionのスケジュールタイプとは?

Stable Diffusionでは、画像生成の過程で「ノイズだらけの画像」から少しずつノイズを取り除き、最終的な画像を描き出していきます。
スケジュールタイプとは、このノイズ除去の「ペース配分」を決める仕組みのことです。
選択するスケジュールタイプによって、画像の特徴や品質、全体の雰囲気が変わるため、目的に応じて最適なものを選ぶことが重要になります。
スケジュールタイプの主な機能

ノイズ除去のペースを調整する機能
ノイズ除去機能とは、真っ白なノイズ画像から徐々にノイズを取り除き、最終的な画像を生成するステップを指します。
このノイズ除去の進行度合い、つまり各ステップでどの程度のノイズを減らすかを調整することで、画像のディテールや質感、全体的な仕上がりが変化します。
サンプラーとスケジュールタイプの関係性
スケジュールタイプは、Stable Diffusionで画像生成時のノイズ除去ペースを調整する機能で、サンプラーと密接に関係しています。
サンプラーはノイズ除去のアルゴリズムを決定し、スケジュールタイプは各ステップでどの程度ノイズを減らすかという「減少カーブ」を指定します。


代表的なStable Diffusionのスケジュールタイプの特徴 まとめ

Stable Diffusionには、多様なスケジュールタイプが存在し、それぞれ異なるノイズ除去の特性を持っています。
これらのタイプを理解することで、より意図した通りの画像を生成することが可能になります。
Automatic

Uniform

Karras

Exponential

- ・Automatic
-
モデルや設定に応じて自動的に最適なスケジューラーを選択します。
- ・Uniform
-
ノイズ除去(デノイジング)のステップ間隔が均等。安定した品質ですが、柔軟性は低めになります。
- ・Karras
-
ステップ間隔が徐々に変化し、自然なノイズ除去が特徴です。高品質な画像生成に利用されています。
- ・Exponential
-
初期ステップで速く、後半ゆっくりとノイズ除去。コントラストや細部を強調したい場合に有効
Polyexponential

SGM Uniform

KL Optimal

Align Your Steps

- ・Polyexponential
-
Exponentialより複雑な曲線でステップを分配。より細かい調整や特殊な生成結果を目指す場合に利用します。
- ・SGM Uniform
-
SGM(Score-based Generative Model)用の均等ステップ。従来のUniformよりもSGMモデルに最適化
- ・KL Optimal
-
KLダイバージェンス(情報理論的な距離)を最適化したスケジューリング。理論的な最適化を目指したい場合に使う
- ・Align Your Steps
-
ステップ配分を目的に合わせて調整。カスタマイズ性が高く、細かな制御が可能
Simple

Normal

DDIM

Beta

- Simple
-
単純なアルゴリズムによるステップ管理。高速だが、画質の最適化は限定的。
- Normal
-
正規分布に基づいたステップ配分。バランスの取れた生成結果を得やすい。
- DDIM
-
DDIM(Denoising Diffusion Implicit Models)方式。少ないステップで高品質画像を生成できる。高速化に強い。
- Beta
-
βパラメータに基づくステップ調整。ノイズ除去の進行を調整しやすいが、上級者向け。

Stable Diffusionのスケジュールの使い方

実際にスケジュールタイプを使ってみます。
使用するcheckpoint(モデル)とサンプラーによって相性があるので、事前にCivit.aiなどで推奨される内容を把握しておくと良いでしょう。
Civit.aiなどで、モデルに対して推奨さされているスケジュールタイプ確認します。
モデルページの概要蘭にサンプラーとスケジュールタイプが記載されているので、生成の際は推奨の内容に合わせます。

ページ中部の「Schedule type」のプルダウンからスケジュールを選択します。

サンプラーとスケジュールタイプを確認して生成を開始します。
標準
Normal

シンプル
Simple

Karras
Karras

好みに合った画質を選択して、同じ生成結果の中で、より質の高い画像を選別しましょう。

Stable Diffusionでスケジュールタイプを使いこなそう!
Stable Diffusionで利用できる各種スケジュールタイプや構文を理解することで、より目的に合った画像生成やAI活用が可能になります。
高性能なGPU環境は、これらのスケジューラーを最大限に活かすためにも重要です。
目的に合わせて組み合わせれば、理想の画像に大きく近づけます。

Stable Diffusionの人物画像生成において、ポーズを生成する際、非常に細かいディテールが求められます。
効率的にStable Diffusionで画像を生成するには、16GB以上のVRAMが搭載されたパソコンの利用がおすすめです。
しかし、高性能なパソコンの多くがが30万円以上と高額になります。
そのような時は、PICSOROBANがおすすめです。
コストを抑えたい方へ:今のパソコンのまま使える「PICSOROBAN」
ピクソロのメリット
- すぐ使える:高額PC不要で、ブラウザからすぐに利用可能。必要な分だけポイントを購入できます。
- リーズナブル:30分約60円で利用可能。さらに今なら約2時間分が無料。
- 無制限作成:時間内であれば、何枚でも画像生成可能。短時間で多くの作品を生成できます。
ブラウザで簡単!ピクソロ!

PICSOROBANは、インストールの必要なくブラウザで簡単にStable Diffusionを利用できます。
さらに、今ならリリースキャンペーンとして無料会員登録するだけで、2,000ポイント(約2時間分)貰えます!
詳しい使い方は下記の記事で紹介しています。
\今なら約2時間無料で使える!/
Stable Diffusionが快適に使えるおすすめのパソコンやグラボに関しては下記の記事で紹介しています。