Stable DiffusionのCFG Scaleおすすめ値は?比較画像付きで解説

Stable DiffusionのCFG Scaleおすすめ値は?比較画像付きで解説

どんなに優れたプロンプト(呪文)を入力しても、CFG Scaleの設定が適切でなければ、その効果は半減してしまいます。

CFG Scaleは、プロンプトへの忠実度をコントロールする重要なパラメータで、低すぎれば指示が無視され、高すぎれば画像が破綻してしまう、Stable Diffusionの中でも特に扱いが難しい設定値です。

この記事では、CFG Scaleの仕組みから、実際の作例を交えながら最適値の見つけ方を解説します。

目次

Stable DiffusionのCFG Scaleとは

見出し画像

StableDiffusionのCFGScaleとは、AIがプロンプト(呪文)にどれだけ忠実に画像を生成するかを決める設定です。

正式名称は「Classifier Free Guidance Scale」といい、この数値を変更することで、AIの創造性を優先させるか、ユーザーの指示を厳密に守らせるかのバランスをコントロールできます。

この仕組みを理解することが、画像生成の質を高める第一歩となります。

CFG Scaleの基本的役割

CFG Scaleは、Stable Diffusionが「どの程度プロンプトに従って画像を生成するか」を決めるパラメータです。

数値を上げるほどAIは指示を厳密に守り、下げるほど自由な発想を取り入れるようになります。

つまり、CFG Scaleは「AIがどこまでプロンプトに従うか」と「どこまで自由に描くか」のバランスを調整する設定値です。

この数値を適切に設定することで、理想のタッチや世界観をより再現しやすくなります。

CFG Scaleの設定傾向と目安

CFG Scaleの数値は、以下のように4つの傾向に分けて考えると理解しやすいです。

このあとの章では、実際に数値を変えて生成した画像例も掲載しているので、見比べながら調整のコツを掴んでみてください。

1〜6:自由で予測不能なイラスト

プロンプトの制約が弱く、偶発的で独創的な構図が生まれやすい。
明確な指示再現には不向きだが、アート的な雰囲気を出したいときに最適。

7〜10:バランスの取れた高品質なイラスト(おすすめ)

忠実さと創造性の両立が取れる標準的な範囲。
多くのモデルでデフォルト値に設定されており、安定した結果が得やすい。

11〜20:プロンプトを強く反映するイラスト

細部まで正確に描写しやすくなるが、彩度やコントラストが強調されやすい。
忠実さを重視したい場合は、11〜12あたりで調整すると良い。

21以上:彩度が高く破綻しやすいイラスト

指示を過剰に反映しようとするため、構図崩壊や発色の破綻が起きやすい。

【画像で比較】CFG Scaleの数値による生成結果の違いを検証

CFG Scaleの数値がイラストにどのような影響を与えるのかを、具体的な画像で比較しながら見ていきましょう。

数値帯によってイラストの雰囲気や忠実度が大きく変わるため、自分の目的に合った設定を見つけるための参考にしてください。

ここでは、同じプロンプトとシード値を使い4つの異なる数値範囲での生成結果の違いを検証します。

CFG Scale: 1〜6(自由な発想で描かれたイラスト)

CFG Scale: 1

CFG Scale: 2

CFG Scale: 3

CFG Scale: 4

CFG Scale: 5

CFG Scale: 6

CFG Scaleを1から6の範囲に設定すると、プロンプトの指示からある程度自由になり、AIの独創性が強く反映されたイラストが生成されやすくなります。

この設定では、細かな指示は無視される傾向にあり、予期しない構図や表現が生まれることが特徴です。

特に数値が3以下の場合、プロンプトの内容とはかけ離れた、ほとんどランダムに近い抽象的な画像になることもあります。明確なイメージを再現するのには向きませんが、アイデア出しや偶然性を楽しみたい場合に適した設定です。

アーティスティックで、ぼんやりとした雰囲気のイラストを求めている場合に利用します。

CFG Scale: 7〜10(指示とのバランスが良い高品質なイラスト)

CFG Scale: 7

CFG Scale: 8

CFG Scale: 9

CFG Scale: 10

CFG Scaleを7から10の範囲に設定すると、プロンプトへの忠実性とAIの創造性のバランスが取れた、高品質なイラストが生成されやすくなります。

多くの画像生成AIサービスやモデルにおいて、この数値帯がデフォルト値として採用されており、最も標準的で安定した結果が期待できる範囲です。

特に「7」は汎用性が高く、初心者にもおすすめの設定値です。

この設定では、プロンプトの主要な要素を維持しつつ、細部には適度な独創性が加わるため、自然で魅力的な仕上がりになります。

特定の目的がない場合や、どの設定にすれば良いか迷った際には、まずこの7から10の範囲で試してみるのが良いでしょう。

CFG Scale: 11〜20(指示を強く反映したイラスト)

CFG Scale: 11

CFG Scale: 12

CFG Scale: 13

CFG Scale: 14

CFG Scale: 15

CFG Scale: 16

CFG Scale: 17

CFG Scale: 18

CFG Scale: 19

CFG Scale: 20

CFG Scaleの設定を11から20の範囲に上げると、プロンプトの指示がより強くイラストに反映されるようになります。

細かな服装の指定やキャラクターのポーズ、背景の要素などを正確に描画させたい場合に有効な設定です。

数値が高くなるにつれて、イラスト全体の彩度やコントラストが強調され、やや不自然な印象を与える可能性が出てきまてしまいます。

意図を正確に反映させたいが、品質も維持したいという場合には、11から12あたりで調整し、生成結果を確認しながら最適な値を把握すると良いでしょう。

CFG Scale: 21以上(彩度が高く破綻しやすいイラスト)

CFG Scale: 21

CFG Scale: 22

CFG Scale: 23

CFG Scale: 24

CFG Scale: 25

CFG Scale: 26

CFG Scale: 27

CFG Scale: 28

CFG Scale: 29

CFG Scale: 30

CFG Scaleを21以上に設定すると、プロンプトの指示を過剰に解釈しようとするため、生成されるイラストが破綻する可能性が非常に高くなります。

この設定では、彩度とコントラストが極端に高くなり、色が飽和して細部が潰れてしまうことがほとんどです。

構図が崩れたり、オブジェクトが不自然な形で描かれたりするなど、イラストとして成立しないケースも少なくありません。

もし意図的に特殊な効果を狙う場合を除き、高品質なイラスト制作を目指すのであれば、20以下の設定に留めておきましょう。

CFG Scaleの数値を変更するとイラストはどう変わる?

CFG Scaleの数値を変更すると、生成されるイラストの品質や雰囲気が大きく変化します。

数値を低く設定すればAIの創造性が発揮されやすくなる一方、高くするとプロンプトの指示に厳密に従うようになります。

CFG Scaleは、他のパラメータとの関連性も深いため、それぞれのメリット・デメリットを理解し、バランスの取れた設定を見つけることが重要です。

【数値が低い場合】創造性が豊かでアーティスティックな作風になる

CFG Scaleの数値を低く設定すると、プロンプトによる縛りが弱まるため、AIが学習したデータからより自由な発想で画像を生成します。

予想外の構図や独創的な色使いなど、アーティスティックで創造性豊かなイラストが生まれやすくなるのが大きなメリットです。

【数値が低い場合】プロンプトの指示から逸脱しやすくなる

CFG Scaleを低く設定する際のデメリットは、プロンプトからのガイドが弱まることで、指示した内容から大きく逸脱した画像が生成されやすくなります。

具体的なキャラクターのポーズや服装、背景などを細かく指定したい場合、数値が低いと思うような結果を得られないことが多くなります。

【数値が高い場合】プロンプトの内容を忠実に再現できる

CFG Scaleの数値を低く設定すると、プロンプトによる縛りが弱まるため、AIが学習したデータからより自由な発想で画像を生成します。

予想外の構図や独創的な色使いなど、アーティスティックで創造性豊かなイラストが生まれやすくなるのが大きなメリットです。

【数値が高い場合】色味が濃すぎたり構図が崩れたりする

CFG Scaleを高く設定しすぎると、プロンプトへの忠実さを追求するあまり、画像の品質が低下するデメリットが生じます。

特に、彩度やコントラストが異常に高くなり、全体的に色味が濃く、けばけばしい印象のイラストになる傾向があります。

目的に合うCFG Scaleの最適値とおすすめ設定

CFG Scaleは、生成したいイラストの方向性によって最適な値が異なります。

ここでは、具体的な目的に合わせたおすすめの設定値を紹介します。

迷ったらまずは汎用性の高い「7」前後に設定しよう

StableDiffusionを使い始めたばかりで、どのCFGScaleの値に設定すれば良いか分からない場合は、まず「7」を基準に試してみることをおすすめします。

「7」に設定すれば、指示から大きく逸脱することなく、かつAIによる自然な補完も期待できるため、安定して高品質なイラストを生成できます。

ここから始めて、生成されたイラストを確認し、もっとプロンプトに忠実にしたいなら数値を上げ、もっと独創的にしたいなら下げるといった形で調整していくのが効率的な使い方です。

高品質なイラストを目指すための効果的な調整方法

より高品質なイラストを目指すには、CFG Scale単体だけでなく、他のパラメータと組み合わせて調整することが効果的です。

例えば、AUTOMATIC1111版のWebUIでは、「Hires.fix」という機能を使って高解像度化する際に、CFG Scaleとは別に「HiresCFG」の値を設定できる場合があります。

また、「サンプリングステップ数」の数値を上げることで、より緻密な描画が可能になり、CFG Scaleの効果を最大限に引き出すことにも繋がります。

一般的に、ステップ数を20~30、CFG Scaleを7~10の範囲で調整するのが基本ですが、使用するモデルの特性に合わせて微調整することが重要です。

これらの設定を総合的に考慮し、試行錯誤を重ねることで、理想の品質に近づけることができます。

CFG Scaleを調整しても理想のイラストにならない時の対処法

CFG Scaleを調整しても、なかなか思い通りのイラストが生成されないこともあります。

そのような場合は、CFG Scale以外の要素に原因がある可能性が高いです。

プロンプトの記述方法や、ステップ数などの他のパラメータ、さらには使用しているモデル自体を見直すことで、問題が解決することがあります。

また、img2img機能を使って元画像を参考に生成するなど、別のアプローチを試すことも有効な手段の一つです。

ステップ数の数値を変更して品質を改善する

CFG Scaleを調整しても品質が向上しない場合、次に試すべきは「サンプリングステップ」の数値変更です。

サンプリングステップは、AIがノイズから画像を生成する際の計算回数(ステップ数)を意味し、この数値が高いほど、より緻密で詳細なイラストが生成される傾向にあります。

一般的に20~30程度が推奨されますが、これを40や50に増やすことで、細部のクオリティが向上することがあります。ただし、数値を上げすぎると生成時間が長くなる上、一定以上では品質向上の効果がなくなるため、バランスの調整が重要です。

CFG ScaleとSamplingstepsは相互に影響し合うため、両方の値を少しずつ変えながら、最適な組み合わせを探してみてください。

プロンプトの記述や単語の順番を見直す

CFG Scaleは、あくまでプロンプトという指示にどれだけ忠実に従うかを決める基準です。

そのため、元となるプロンプトの質が低ければ、いくらCFG Scaleを調整しても良い結果は得られません。

理想のイラストにならない時は、プロンプトの記述を見直しましょう。

より具体的で明確な単語を使う、単語の順番を入れ替えて強調したい要素を前に持ってくる、あるいは不要な単語を削除するなど、様々な組み合わせを工夫していきましょう。

使用するモデル(Checkpoint)を変えて試してみる

生成されるイラストの根本的な画風やクオリティは、使用しているモデルに大きく依存します。

CFG Scaleやプロンプトをいくら調整しても好みのイラストにならない場合、モデル自体が目指す画風と合っていない可能性があります。

目的に合いそうなモデルを少しずつ置き換えて試して生成を繰り返してみるのは、解決のヒントを見つけるうえでとても有効なアプローチです。

Stable DiffusionでCFG Scaleを使いこなそう!

今回は、Stable DiffusionのCFG Scaleについて解説しました。最短でベスト設定を見つけるには、大量のプロンプトを試行で回すのが近道です。

そこでおすすめなのが、クラウドGPUの活用です。

  • 初期費用ゼロで、RTX 4090〜H100クラスのGPUをすぐに利用可能
  • WebUI/ComfyUIのテンプレートでCFG/Steps/Samplerの一括検証が簡単
  • スポット/従量課金で、検証コストを最小化

今なら会員登録だけで無料クレジットや割引キャンペーンを利用できるプランもあります。まずは無料登録して、あなたのモデル・解像度・サンプラーに最適なCFG Scaleを実データで検証しましょう。

最短当日から、狙い通りの高品質イラストを量産できる環境が整います。

GPUSOROBAN
GPUSOROBAN

GPUSOROBANは、高性能なGPU「NVIDIA A4000 16GB」を業界最安値の1時間50円で使用することができます。

さらに、クラウドGPUを利用しない時は停止にしておくことで、停止中の料金はかかりません。

クラウドGPUを使えばいつでもStable Diffusionの性能をフルに引き出すことができるので、理想の環境に近づけることができます。

\快適に生成AI!1時間50円~/

Stable Diffusionが快適に使えるおすすめのパソコンやグラボに関しては下記の記事で紹介しています。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

目次