Stable Diffusionのネガティブプロンプト利用法とその効果

Stable Diffusionのネガティブプロンプト利用法とその効果

「Stable Diffusion」には「ネガティブプロンプト」と呼ばれる、画像の生成に不可欠な要素があり、ネガティブプロンプトを使いこなすことができれば飛躍的に画像の精度が上がります。

この記事ではStable Diffusionのネガティブプロンプトの仕組みや入力方法について解説します。

目次

Stable Diffusionのネガティブプロンプトとは?

煌めきのイメージの見出し画像

Stable Diffusionのプロンプトとは、生成したい画像の単語や文章を入力する内容を指します。

一方、ネガティブプロンプトとは、画像を生成する際に除外したい内容のテキストを入力することを指します。

プロンプトとネガティブプロンプトの両方の要素を入力することによって、画像のクオリティが上がります。

それ以外にも、分割生成や画像内の矛盾を防ぐ効果もネガティブプロンプトに含まれています。

Stable Diffusionのネガティブプロンプトのおすすめ

閃きの見出し画像

Stable Diffusionで画像を生成する上でおすすめのネガティブプロンプトを紹介します。

生成したい画像パターンに合わせて参考にしてみてください。

Stable Diffusionで低品質な画像の出力を防ぐネガティブプロンプト

Stable Diffusionで、どの画像生成にも利用されている、基本的な画質に関するネガティブプロンプトです。

画質やピントずれ、JPEG圧縮による劣化などを防ぐ効果があります。

画質に関する代表的なネガティブプロンプト例です。

単語意味効果
low quality低品質高品質を出力します
worst quality最悪の品質最悪の品質を避けます
out of focus焦点が合っていないピントを合わせます
ugly醜い醜さを排除します
errorエラーエラーを排除します
JPEG artifactsJPEG 圧縮の不具合JPEG 圧縮による画質低下を防ぎます
low resolution低解像度解像度を上げます
blurryぼやけた全体のぼやけをなくします
bokehボケピンぼけなどをなくします
lowers画質を下げる画質を上げます
poor quality乏しい質質を向上させます
(2024年4月現在)

Stable Diffusionでnsfwを防ぐためのネガティブプロンプト

nsfwとは、不適切なコンテンツのことを表しており、アダルト要素などを排除することができます。

単語意味効果
nsfw成人向けの要素を含む成人向け要素を排除します
nipples胸部の突起部分乳首の露出を防ぎます
pubic hair陰部の毛陰部の毛を排除します
nude裸の表現を排除します
bare navelへそ出しへそ出しを防止します
exposed skin露出した肌肌の露出を防止します
exposed chest露出した胸露出した胸の表現を防止します
(2024年4月現在)

Stable Diffusionで作画崩壊や奇形を防ぐためのネガティブプロンプト

人間や物体の不自然な形状、細かいデッサンの崩れなどを防ぐネガティブプロンプトです。

Stable Diffusionで生成する画像の自然な見た目とバランスが保たれます。

単語意味効果
bad anatomy人体の不正確な構造人体の不正確な構造の出現を防止します
deformed変形した変形した部位の出現を防止します
bad face不快な顔不快な顔の出現を防止します
extra_arms余分な腕余分に増える腕の出現を防止します
disconnected_limbs切り離された四肢四肢の分離を防止します
exposed inaccurate limbchest四肢の形が正確でない四肢の形を正確にします
extra_fingers余分な指余分に指が増えないように抑制します
extra_legs余分な足余分に足が増えないように抑制します
missing_limb欠落している四肢四肢が欠落しないように抑制します
floating_limbs浮遊する四肢不自然に浮き上がらないように抑制します
mutated hands異常な手手の異常を抑制します
missing fingers欠けている指指が欠けないように抑制します
fewer digits指が少ない指の数が不足しないように抑制します
deformed mutated変質・変異パーツが変異しないように抑制します
(2024年4月現在)

Stable Diffusionでロゴやテキスト(文字)を取り除くネガティブプロンプト

Stable Diffusionでは、学習済みデータにあるアーティストのサインや、著作権が存在する文字が挿入されてしまうことがあります。

これらを排除するために使用されるネガティブプロンプトです。

単語意味効果
textテキストテキストの入り込みを防止します
logoロゴロゴの映り込みを防止します
signatureサインサインやマークなどの出現を防止します
artistアーティストアーティストのサインなどの出現を防止します
nameネーム個人名などの名前の入り込みを防止しします
(2024年4月現在)

Stable Diffusionで分割生成を避けるネガティブプロンプト

複数の角度からの表示や分割した絵が表示される状況を防ぎます。

トリミングされた画像や断面図の出現も排除することができます。

単語意味効果
multipul複数複数の角度から画像生成されるのを防ぎます
split view分割画面画面の分割を防ぎます
grid viewグリッド表示補助線の出現を防ぎます
two shot2人の人物2人の人物が同じ画面に生成されるのを防ぎます
croppedトリミングトリミングされた画像の出現を防ぎます
cross section断面断面画像の出現を防ぎます
(2024年4月現在)

Stable Diffusionのネガティブプロンプトの書き方

Stable Diffusionのネガティブプロンプトの書き方は、プロンプトの書き方と同じで基本的に前に記述する単語が優先されるようになっています。

指示を出し過ぎて、後ろになると優先度が下がってしまうので、前方の単語をシンプルに入力するとうまくいきやすいです。

実際にネガティブプロンプトを入力するのとしないのではどのくらい差があるのか検証してみました。

日が差している街頭で、キャミソールとスカートを着ている茶髪のロングヘアーの美しい女性が笑顔ではにかんでいる絵を高い品質で生成します。

プロンプト

[Top quality, 1 beautiful woman, long Hair, brown hair, wearing Camisole, skirt, shy-smile, Sunlight, at street]

ネガティブプロンプトなし

次に複数のネガティブプロンプトを入力してクオリティをあげてみます。

不自然に長い首、服装のバランスをネガティブプロンプトで修正します。

(出典:Stable Diffusion Web UI)
ネガティブプロンプト

[worst quality, low quality, lowres, nsfw, Blurry pupil, bad eyes, long neck, extra_arms, mutated hands, inaccurate limb, unnatural clothing, error, bad anatomy]

ネガティブプロンプトあり

結果、全体的な見た目とバランスが良くなりました!

ネガティブプロンプトは、生成した画像をから徐々に要素を排除していく使い方がおすすめです。

Stable DiffusionのEasyNegativeとは?

未来を感じさせる見出し画像

Stable Diffusionにおいては、出力される画像の内容を緻密に制御して最適化するためにネガティブプロンプトが不可欠で、品質を上げるという大きなメリットがあります。

一方で、ネガティブプロンプトは指定が細かくなりがちな上、似たようなプロンプト指定になってしまう場合が多いです。

Stable Diffusionには面倒なネガティブプロンプトを入力しなくても、たった一つのネガティブプロンプトで画像のクオリティをアップするパッケージがいくつかあります。

その中でも人気なのが「EasyNegative」と「EasyNegative V2」です。

EasyNegativeは制作者がStable DiffusionのモデルCounterfeitと同じため相性が良いですが、他のモデルの場合でも効果を発揮します。イラスト系に強い傾向があります。

「EasyNegative」の導入方法

STEP
EasyNegativeをダウンロード

Hugging Face」からデータをダウンロードします。

EasyNegative.safetensorsのリンクからダウンロードを選択します。

EasyNegative
(出典:huggingface.co)
EasyNegative
(出典:huggingface.co)
STEP
「embeddings」フォルダの中に入れる

ダウンロードしたファイルをStable Diffusion web UIをインストールしているフォルダを開き、「embeddings」フォルダの中に入れます。

EasyNegative

ファイルの導入が完了したらStable Diffusion web UIを起動して完了です。

STEP
ネガティブプロンプトに「EasyNegative」を入力

EasyNegativeの使い方は、ネガティブプロンプトの入力欄に「EasyNegative」を入力するか、Textual Inversionタブに移動し、グレーの画像を選択するだけです。

EasyNegative
(出典:Stable Diffusion Web UI)


Stable Diffusionを使うならクラウドGPUがおすすめ

Stable Diffusionでネガティブプロンプトを駆使しながら何度も画像を生成していくには、GPUパワーが必要です。

クラウドGPUを使えば、ストレスのない画像生成を何度でも行うことができ、いつでもすぐに使用できるため便利です。

GPUSOROBAN
https://soroban.highreso.jp/

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUB編集部からのお知らせ

無料ウェビナーのお知らせ

ソフトバンクSarashinaウェビナー

日本語LLM「Sarashina」& OCR機能「Phi-3 Vision」の 無料オンラインウェビナー!

開催日時:
2024年7月24日(水) 14:00~15:00

内容:

  • 「Sarashina」や「Phi-3 Vision」の概要と使い方の紹介
  • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

このウェビナーでは、ソフトバンクの日本語の強いの大規模言語モデル「Sarashina」の使い方や、実際にどのように使えるかを具体的に紹介します。

また、画像からテキストを抽出するOCR機能を簡単に作成できる「Phi-3 Vision」の使い方もデモを交えてお見せします。

生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

こんな方におすすめ!

  • 最新のAI技術やトレンドに興味がある方
  • AI開発に携わっている方
  • 生成AIの実用的な活用方法を学びたい方
  • 新しいツールや技術を積極的に取り入れたい方

\参加申し込みはこちら!/

この記事を書いた人

EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

目次