Stable Diffusion 3.5 ControlNetの使い方！ ComfyUIで画像生成に挑戦

2024年12月6日2024年12月17日

Stability AIは11月26日、「Stable Diffusion 3.5 Large」上で使用できるControlNetの機能3種「Blur」「Canny」「Depth」を発表しました。

「Stable Diffusion 3.5 ControlNet」は、Stable Diffusionの主要機能であるControlNetの最新バージョンになります。

この記事では、「Stable Diffusion 3.5 ControlNet」の使い方を初心者向けに詳しく解説します。

リリース記念、2,000Ptプレゼント！

Stable Diffusion 3.5 ControlNetとは？

Stable Diffusion 3.5 ControlNetは、インテリアデザインからキャラクター制作まで幅広い用途に最適できる拡張機能です。

今回発表された機能は「Blur」「Canny」「Depth」の3つです。

それぞれ特徴は下記にまとめました。

Stable Diffusion 3.5 ControlNetの特徴

「Blur」8K ～ 16K の解像度を含む、高いアップスケーリングが可能！
「Canny」エッジマップを抽出して生成された画像を構造化します！
「Depth」深度マップを使用して、画像生成を構成を正確に制御します！

Blurの特徴

「Blur」は、低解像度の画像をアップスケール（拡大）する拡張機能です。

現在まで、完成した画像の質を保ったままスケールアップするのは困難でしたが、AIが構成内容を再描画することで高画質化が可能になりました。

「Blur」を使用すれば、8K ～ 16Kなどの画像サイズにも質を落とすことなく生成が可能です。

Cannyの特徴

「Canny」は、線画をそのままに色塗りを自由に変更できる拡張機能です。

イラストに対して特に便利で、その他にもあらゆるスタイルに適用ができます。

Depthの特徴

「Depth」は、参照画像の立体的な構図を抽出して生成することができる拡張機能です。

線画などでは表現ができない奥行きがある構図を指定したい場合は「Depth」がおすすめです。

あわせて読みたい

Stable DiffusionのControlNetとは？インストールから解説！【SDXL対応】 Stable DiffusionにはControlNetと呼ばれる拡張機能があります。 ControlNetを利用することによって、画像からポーズを抽出したり、線画を抽出したりして画像を生成する…

Stable Diffusionの使い方は、機能別に下記の記事にまとめているのでぜひご覧ください

あわせて読みたい

Stable Diffusionまとめ！プロンプトや使い方が丸わかり Stable Diffusionは、絵を描くスキルがなくても直感的に高品質な画像を生成できる画像生成AIです。この記事では、Stable Diffusionの基本的な使い方から具体的なプロン...

Stable Diffusion 3.5 ControlNetの使い方

ここでは、「ComfyUI」上でのStable Diffusion 3.5 ControlNetの使い方を紹介します。

STEP

Stable Diffusion 3.5 の起動環境を用意

Stable Diffusion 3.5 ControlNetは、多くのGPUパワーが必要になりますので、余裕をもって準備をしておきましょう。

導入前に「ComfyUI」を起動して最新版に更新しておきましょう。

まずは「ComfyUI」上でStable Diffusion 3.5を動かす準備をします。

既にStable Diffusion 3.5を動かすデータセットがある方は、次のステップに進みます。

導入までのステップは、こちらの記事で紹介しています。

あわせて読みたい

「Stable Diffusion 3.5」ローカル環境の使い方！ ComfyUIで画像生成 Stability AIは、2024年10月22日に最新の画像生成AIモデル「Stable Diffusion 3.5」をリリースしました。 Stable Diffusion 3.5とは、Stable Diffusionの最新ベースモデ…

STEP

モデルデータを入手

Stable Diffusion 3.5 ControlNet用に学習されたモデルをダウンロードします。

Hugging FaceからStability AIが公式に配布しているモデルデータを入手します。

「ComfyUI」>「models」>「controlnet」を開き、データを格納します。

合計で26Gほどあるので気長に待ちます。

STEP

「ComfyUI」を起動してワークフローを入手

データのセットが完了したらComfyUIを起動します。

ControlNetを使用する前にComfyUIを最新版に更新しておきます。

ComfyUIの公式ブログからStable Diffusion 3.5 ControlNet専用のワークフローを入手します。

それぞれ3枚のワークフローが埋め込まれている画像をダウンロードします。

デモ画像（ワークフロー）はこちらから入手
https://blog.comfy.org/sd3-5-large-controlnet/

ComfyUIの画面にドラッグ＆ドロップで画像を読み込むと埋め込まれているワークフローデータを表示することができます。

ワークフローを展開して、各ノードが正常に反映されているかを確認します。

赤くなっている未入手のカスタムノードがある場合は、手動で補填していきます。

右のパネルの「Manager」ボタンをクリックして、中列の「Install Missing Custom Nodes」を選択します。

足りないカスタムノードが一覧で表示されるので、ノードをインストールします。

STEP

パラメータを設定して生成開始！

再起動して赤いノードがないことを確認して生成を開始します。

Checkpointには、「sd3.5_large_fp8_scaled.safetensors」を利用しますので用意がない場合は下記サイトからダウンロードしておきましょう。

モデル: sd3.5_large_fp8_scaled.safetensors (14.9GB)
https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8

Blur

Blurは、画像の解像度を上げるアップスケールする機能です。

素材の画像を用意して生成したい解像度のサイズを入力します。

今回は素材画像（512×512）を2倍の（1024×1024）サイズにアップスケールして生成したいと思います。

Load image
・アップスケールしたい素材の画像を読み込みます。

Prompt

・変更内容を含めたプロンプトを入力します。

今回は絵の内容に変更はないので、プロンプトは絵の内容だけを入力します。

各種のパラメータやプロンプト以外の入力項目やパラメータは、入力しなくても問題ありません。

生成は右上の「Queue Prompt」ボタンをクリックて生成を開始します。

初回の生成はモデルデータのダウンロードを伴うので時間がかかります。

使用したプロンプト

A woman wearing Japanese clothes holding a cat

Canny

Cannyは、元の画像から輪郭線を抽出して新たに画像を生成する機能です。

デザイン線画を元に再度画像生成してくれるので、塗り方のパターンを増やすことができます。

今回は素材画像から線画を抽出して画風を変えて生成してみたいと思います。

Load image
・線画を抽出したい素材の画像を読み込みます。

Prompt

・変更内容を含めたプロンプトを入力します。

今回は絵の内容に変更はないので、プロンプトは絵の内容だけを入力します。

各種のパラメータやプロンプト以外の入力項目やパラメータは、入力しなくても問題ありません。

生成は右上の「Queue Prompt」ボタンをクリックて生成を開始します。

線画の抽出から書き出しまで1アクションで完了します。

使用したプロンプト

Wearing a black hoodie and drinking a drink

Depth

Depthは、奥行きがある構図の画像が最も素材として適しています。

深度がない平面が背景になっているような画像は、Depthでは反映ができずに内容が上書きされてしまうので注意しましょう。

今回は素材画像の立体感を維持しながら画風を水彩風に変えて生成してみたいと思います。

Load image
・線画を抽出したい素材の画像を読み込みます。

今回は横長の画像サイズの深度を抽出するので、生成さする画像の比率も横長に指定します。

Prompt

・変更内容を含めたプロンプトを入力します。

画像サイズ以外の入力項目やパラメータは、入力しなくても問題ありません。

生成は右上の「Queue Prompt」ボタンをクリックて生成を開始します。

線画の抽出から書き出しまで1アクションで完了します。

使用したプロンプト

high quality,Colorful color palette,high-level image quality,(Little girl with makeup:1.37),Unprecedented amount of drawing,style of anime,(Cosmetics and decorations)，Geometric pattern background,frontage,Sticker style,(((stylish fashion))), 8K Quality,Intense watercolor, Detailed watercolor art, Watercolor splash, Surreal, avant-garde pop art, Beautiful and expressive paintings, Beautiful artwork illustration, Very colorful tones, wonderful, Cool beauty, highest quality,Official Art, Vector art, Stylish design, (((The most beautiful girl))), (((chibi))), (((highest quality))), HDR, ((detailed)), ((Doodle Art)), ((masterpiece)), ((Super detailed)), (((Colorful flowers))),(((Stylish)))

あわせて読みたい

Stable Diffusionのキュンとするポーズ！プロンプト(呪文)集 Stable Diffusionでキュンとするポーズの画像を生成したい！という場合にStable Diffusionでは、アングルやポーズを強調することで、魅力的な画像を生成することができ…

Stable Diffusion 3.5 ControlNetの商用利用は？

Stable Diffusion 3.5 ControlNetの料金プランと商用利用に関して紹介します。

Stable Diffusion 3.5 ControlNetの料金プラン

Stable Diffusion 3.5 ControlNetの公式プロジェクトは、商用および非商用の両方で無料で使用することができます。

非営利使用は無料で、個人および組織は非営利目的でモデルを無料で使用できます。

Stable Diffusion 3.5 ControlNetの商用利用は？

Stable Diffusion 3.5の商用利用には制限が設けられています。

Stability AIのコミュニティライセンスによると年間収入が100万ドル未満の個人や組織は研究用、非商用利用、商用利用が可能になります。

年間収入が100万ドルを超える場合は、Stability AIからエンタープライズライセンスの取得が必要になります。

コミュニティライセンスの概要は以下の通りです。

目的	料金	商用利用	備考
非営利目的	無料	可	–
商用利用	無料（年間収益100万ドルまで）	可	100万ドル以上の企業は、エンタープライズライセンスの問い合わせが必要