Stable Diffusionで画像を生成する際、理想的な構図やポーズを完全に再現するのは難易度が高いと言えます。
しかし、適切なプロンプトを組み合わせられれば、再現度を上げられます。
この記事ではStable Diffusionで理想の構図指定に関するテクニックを解説していきます。
Stable Diffusionで全体の構図を指定するプロンプト

Stable Diffusionでは構図に関する呪文によって全体の構図をコントロールできます。
ここからは被写体に対しての全体構図を画像付きで紹介していきます。
Stable Diffusionプロンプト:正面の構図
正面のアングルや真正面のカメラ目線は下記のプロンプトを使います。
カメラ目線で視線を合わせることで、親近感や距離感を強く表現できます。
正面のアングル
from front

カメラ目線
look at viewer

Stable Diffusionプロンプト:横からの構図
横顔をメインにする構図に使用するプロンプトです。
Profileは、目線を横(本人の正面)に外した構図が生成されます。
横のアングル
from side

プロフィール
profile

Stable Diffusionプロンプト:斜めからの構図
斜めからの構図は、被写体に合わせてカメラを傾けたような構図や自撮りシーンなどがあります。
被写体に動きがあるような場合に動的アングルのプロンプトを使います。
斜めのアングル
dutch angle

自撮り風
selfie shot

Stable Diffusionプロンプト:上からの構図
上から見下げる構図で利用するプロンプトは、 from aboveがおすすめです。
数回生成を試してみて、より良い角度からの画像を選別しましょう。
overhead shotは、頭上から真下に急角度で見下ろすような構図が生成されます。
上から見下るアングル
from above

真下に急角度
overhead shot

Stable Diffusionプロンプト:下からの構図
下からの構図で使用するのはfrom belowがおすすめです。
強調構文を使うと、被写体をより深い角度から見上げる構図が作れます。
lower angleは、被写体の足元を中心に全体を構成します。
見上げるアングル
from below

足元から全体の構図
lower angle

Stable Diffusionプロンプト:引きの構図・遠くからの構図
引きの構図には、被写体全体が見えるようにする構図と、被写体を中心に横長のワイド画角で撮影する構図の2種類があります。
被写体全体に対してはfar angle、ワイド画角で構成する場合はwide shotを使います。
遠めのアングル
far angle

広角ワイド
wide shot


Stable Diffusionで人物画像の構図を指定するプロンプト

Stable Diffusionでは、人物の強調したいポイントをメインに構図を指定できます。
ここからは被写体のパーツにピックアップした構図を画像付きで紹介していきます。
Stable Diffusionプロンプト:顔アップの構図
顔のアップの構図は目線を正面に合わせたface close upがおすすめです。
顔全体をメインにアップで生成する場合はhead shotなども有効です。
その他、指定した顔のパーツをメインにアップにするプロンプトclose-up of (顔のパーツ)などがあります。
顔のアップ
face close up

顔を中心
head shot

Stable Diffusionプロンプト:上半身の構図
上半身の構図は、upper body,half body shotを使うのがおすすめです。
首から上や肩から上を指定したい場合はportraitを使うといいでしょう。
上半身のアングル
upper body

ポートレート
portrait

Stable Diffusionプロンプト:全身の構図
全身の立ち姿(立ち絵)を構図とするプロンプトはtotal_bodyがオーソドックスです。
full body+ standingや動きのあるプロンプトを追加することで、縦長の立ち絵サイズに収まるように全体のバランスを取ります。
その他、しぐさやシーンを切り抜くような構図はportraitを追加するのがおすすめです。
全身が収まる構図
total_body

ポートレート風
body_portrait

Stable Diffusionプロンプト:後ろ姿の構図
「背中が見える」「後ろを向いた」などの後ろ姿の明確な指定を含めます。
さらに背景を明確に指定することで、構図全体が整いやすくなります。
背中が見える構図
rear view

後ろを向いた構図
from behind


SStable Diffusionで背景に構図を指定するコツ

Stable Diffusionで背景に構図を指定するプロンプトは、具体的な要素、視点、スタイル、雰囲気などを詳細に入力します。
以下のプロンプトの基本構造に従って構成することで、理想的な生成結果が出やすくなります。
背景の主題やテーマ
どのような背景なのかを具体的に記述します。
山の風景、都市の夜景、海辺の景色など、画像全体のテーマを決めます。
構図の視点
構図におけるカメラの視点を指定します。
「俯瞰的な視点」、「近景に木、遠景に山」、「広角レンズのような構図」など遠近に関するプロンプトをStable Diffusionに入力します。
スタイルや雰囲気
アートスタイルや雰囲気を決めます。
「リアリスティック」、「油絵風」、「幻想的な雰囲気」など描画スタイルをStable Diffusionで指定します。
色調や光の設定
色彩や光源について記述します。
Stable Diffusionでは、「スポットライト」「夕日が差し込む温かいオレンジ色」「薄暗い青いトーン」など、光の色や加減を調整できます。

Stable Diffusion構図を変える応用テクニックと拡張機能

Stable Diffusionで画像生成をする際に、構図を重視してプロンプトを組み合わせる方法があります。
カメラアングルや視点、前景・中景・背景などの要素をStable Diffusionに細かく指定することで、生成される画像の構図をコントロールしやすくなります。
Stable Diffusionで構図を変えないための固定プロンプト
Stable Diffusionで生成を繰り返しても構図が崩れないようにするためには、「プロンプトの固定」に加え、「同じシード値」や「同じ設定(Sampler、CFG Scale、Step数など)」を使うのが有効です。
- プロンプトで画角を限定
-
カメラレンズを設定する「50mm lens shot」や被写体までの距離を指定する「medium shot」「wide shot」をはっきり書くと、構図を固定化しやすくなります。
- 同じシード(value)を指定
-
例:seed=123456789 など
- Sampler、ステップ数、 CFG Scaleなどを固定
-
Samplerやステップ数は構図の変化だけでなく、ディテールや発色にも関わります。
ControlNetを使った構図固定と細部のポーズ調整
Stable DiffusionのControlNet(openpose、depth、scribble など)を活用することで、テキストプロンプトだけでは不安定になりがちな「構図」「奥行き」「ポーズ」よりも強力に固定ができます。
大まかな構図や形を持つラフや下絵などのガイド画像を用意して、それぞれのモジュールに落とし込みましょう。
・OpenPose:人物の骨格(ポーズ)を抽出し、同じポーズを再現
・Canny / Scribble / Lineart:線画や輪郭で構図を指定して、俯瞰図や背景の大まかな配置を固定
・Depth:被写体や背景の奥行き情報を参考に、構図の遠近感をキープ
・Segmentation:背景・人物・物体のセグメント分割により配置を固定

Stable Diffusionで構図を指定してみた

実際にStable Diffusionで構図を指定して、パターン別に生成結果を比較してみます。
プロンプトとControlNetを利用した構図のそれぞれの違いがどのように表現されるのかを検証します。
固定されたプロンプトを用いた構図

カメラレンズを設定する「10mm lens shot」と「wide shot」をプロンプトにすると距離を一定に保ち、構図全体が安定します。
使用したプロンプト
high quality,Colorful color palette,high-level image quality,Unprecedented amount of drawing,style of anime,(10mm lens shot:1.2),medium shot,(Best Quality,High resolution:1.2), Ultra-detailed, Anime 2D,manga, 8k, Anime style, anime 2D wallpaper, best composition, ultra-detailed, 8K Quality, colorful palette, cinematic illustration, spring scene with cherry blossoms, girl with orange hair, happy smile, jumping pose, white shorts, indigo socks, black tights, soft lighting, depth of field, intricate details, best quality, sunny day, petals floating, natural expressions, vivid eyes, beautiful face, perfect proportions, ray tracing, glowing skin, Intense watercolor,lustrous skin,(shine), lighting, ray tracing, depth of field, soft lighting, sidelighting, (shine), smile, perfect face, lustrous skin, highly detailed face, highly detailed eyes , perfect face, perfect nose, perfect hair, perfect eyes, beautiful hair, beautiful face, extremely detailed face, beautiful detailed eyes, beautiful body, beautiful legs, beautiful fingers, lovely, (very detailed background:1.0),(highly detailed background:1.0)
ControlNetを使った構図

・Canny :構図を固定して衣装と髪色をアレンジ
・OpenPose:ポーズを固定して背景を変更
・Depth:被写体や背景の奥行き情報を参考に、構図の遠近感をキープ
・Scribble:素材画像からラフを書き出してイメージを拡張

Stable Diffusionでカメラアングルをうまく使いこなそう

Stable Diffusionで構図にこだわるには、高いスペックのPCと数多くの生成回数が必要です。
イメージに合ったカメラアングルを試行して、オリジナルの構図をデザインしてみましょう。
効率的にStable Diffusionで画像を生成するには、16GB以上のVRAMが搭載されたパソコンの利用がおすすめです。
しかし、高性能なパソコンの多くがが30万円以上と高額になります。
そのような時は、PICSOROBANがおすすめです。
コストを抑えたい方へ:今のパソコンのまま使える「PICSOROBAN」
ピクソロのメリット
- すぐ使える:高額PC不要で、ブラウザからすぐに利用可能。必要な分だけポイントを購入できます。
- リーズナブル:30分約60円で利用可能。さらに今なら約2時間分が無料。
- 無制限作成:時間内であれば、何枚でも画像生成可能。短時間で多くの作品を生成できます。

PICSOROBANは、インストールの必要なくブラウザで簡単にStable Diffusionを利用できます。
さらに、今ならリリースキャンペーンとして無料会員登録するだけで、2,000ポイント貰えます!
詳しい使い方は下記の記事で紹介しています。
\約2時間無料で使える!/
Stable Diffusionが快適に使えるおすすめのパソコンやグラボに関しては下記の記事で紹介しています。