Stable Diffusionは、モデルを利用することで細かなスタイルや雰囲気を学習し、高品質な画像を簡単に生成することができます。
この記事では、Stable Diffusionでのモデルの使い方や特徴を解説していきます。
Stable Diffusionモデルとは?
Stable Diffusionのモデルとは、Stable Diffusionに学習させるデータセットのことを指します。
モデルを活用すると、一からプロンプト入力しなくても、モデルに応じた細かなスタイルや雰囲気などを活用でき、AI画像を生成しやすくなります。
例えば、アニメ系のモデルを導入すれば、プロンプトでスタイルを指定しなくてもアニメイラスト画像が生成されます。
また、既存のモデルデータを組み合わせてオリジナルデータ(マージ)を作成することも可能です。
Stable Diffusionモデル一覧とその特徴
Stable Diffusionのモデルは、配布されているサイトからダウンロードすることができます。
ここからは、カテゴリー別にStable Diffusionモデルのおすすめを紹介していきます。
Stable Diffusion実写・リアル系人気モデル
主に実写に近いリアルな画像生成する際に利用されるStable Diffusionモデルを紹介します。
SDXL -base-1.0
SDXLは、Stable Diffusion XLの略で、Stable Diffusionの開発元であるStability AI社が提供するモデルです。
実際にSDXLで画像を生成してみます。
公園で長い黒髪の美しい日本の女の子が立っている画像を生成したいと思います。
[(masterpiece),((ultra-detailed)), (ultra highres), (best quality:1.2), solo, beautiful japanese girl ,smile, (pink kimono:1.2), Portrait , perfect face, sidelighting, lustrous skin, lighting, ray tracing, perfect anatomy , beautiful eyes,shiny,glittering,color,sparkle,glitter,shine,glow,effect, long black hair , standing, park]
[傑作、超詳細に、超高解像度、最高品質:1.2倍、ソロ、美しい日本の女の子、ピンクの着物、笑顔、ポートレート、完璧な顔、サイドライト、光沢のある肌、ライティング、レイトレーシング、整った体型、美しい目、光沢のある、キラキラしている、色、輝き、キラキラ、効果、長い黒髪、立ち姿、公園]
ネガティブプロンプト
[negativeXL_D, ((missing fingers , bad hands , bad anatomy:1.3)) , monochrome , grayscale , watermark , bad legs , bad arms , molebad hands ,(deformed, distorted, disfigured:1.3), ugly, noisy, blurry, (worst quality, low quality, normal quality, bad quality:1.4) , close up, zoomed in,cartoon, ((disfigured)), ((bad art)), ((deformed)), ((poorly drawn)), ((extra limbs)), weird colors, blurry]
[negativeXL_D、欠けている指、悪い手、悪い解剖学:1.3倍、モノクロ、グレースケール、透かし、悪い足、悪い腕、モグラ悪い手、変形、歪み、外観の変化:1.3倍、醜い、うるさい、ぼやけている、最悪品質、低品質、通常の品質、悪い品質:1.4倍 、クローズアップ、ズームイン、漫画、醜い、ひどいアート、下手に描かれた、余分な手足、奇妙な色]
きめ細かさが特徴のモデルだけあって、細部まで繊細な画像が生成できました。
License | CreativeML Open RAIL++-M License |
利用上の注意 | ○クレジットなしでの利用 ×生成物の販売 ○有料生成サービスへの利用 ○マージモデルのシェア ×マージモデルの販売 ×マージモデルシェア時の制限変更 |
PicX_real
PicX_realは、リアル風(実写)の画像生成に特化したStable Diffusionモデルです。
AI美女をStable Diffusionで生成してみたい人におすすめです。
フードを被った日本のアイドル風の少女を生成してみます。
[(masterpiece, raw photo, ultra quality), absurdres, (photo realistic:2), high quality, best quality,high detail raw color photo,skiny skin, professional photograph,Beautiful japanese idol girl, solo, look at viewer, hoodie, upper half of the body, insanely detailed, 4K, studio background, necklace]
[傑作、生写真、超高画質、非日常的な、フォトリアル:2倍、高画質、最高画質、ハイディテール生カラー写真、美肌、プロ写真、日本の美少女アイドル、ソロ、カメラ目線、パーカー、上半身、非常に詳細、4K、スタジオの背景、ネックレス]
ネガティブプロンプト
[(worst quality:2) , (low quality:2) , (normal quality:2) , lowres , bad anatomy , missing fingers , bad hands , monochrome , grayscale , watermark , bad legs , bad arms , mole]
[最悪の品質:2倍、低品質:2倍 、通常の品質:2倍 、低解像度、悪い構造、欠けている指、悪い手、モノクロ、グレースケール、透かし、悪い脚、悪い腕、ほくろ]
リアルな可愛いAI美女を生成することができました。
License | CreativeML Open RAIL-M |
利用上の注意 | ○クレジットなしでの利用 ×生成物の販売 ×有料生成サービスへの利用 ×マージモデルのシェア ×マージモデルの販売 ○マージモデルシェア時の制限変更 |
Stable Diffusionイラスト・アニメ系人気モデル
次はイラストやアニメ系のStable Diffusionモデルを紹介します。
Anythingシリーズ
Anythingシリーズは、イラスト生成のStable Diffusionモデルの中で最も有名なモデルです。
高品質が大きな特徴で、アニメ塗りで生成される絵の完成度はとても高いです。
これまでAnything V5が主流でしたが、2024年3月に新たにXLがリリースされたので、今回はその新しいAnything XLを利用して、魔法使いの少女の絵を生成してみたいと思います。
[(masterpiece),((ultra-detailed)), (highly detailed CG illustration), (best quality:1.2), solo, anime, 1girl,smile,((Black hair color:1.5)), Portrait ,(full body :1.1), perfect face, sidelighting, lustrous skin, lighting, ray tracing, perfect anatomy , dressed in black formal clothes , girl wizard using magic,beautiful eyes,god gesture,glittering,color,sparkle,glitter, in school class room]
[傑作,超詳細に, 高精細CGイラスト, 最高品質:1.2倍, ソロ, アニメ, 1人, 笑顔,黒髪:1.5倍, ポートレート,全身: 1.1倍、完璧な顔、サイドライト、光沢のある肌、照明、レイトレーシング、完璧な体型、黒いフォーマルな服、魔法を使用する女の子の魔法使い、美しい目、神のジェスチャー、光沢のある、色、輝き、キラキラ、学校の教室]
ネガティブプロンプト
[nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name]
[不適切なコンテンツ、低解像度、悪い構造、悪い手、テキスト、エラー、指が欠けている、余分な指、指の本数が少ない、切り取られている、最悪の品質、低品質、通常の品質、JPEG圧縮のアーティファクト、署名、ウォーターマーク、ユーザー名、ぼやけている、アーティスト名]
License | CreativeML Open RAIL++-M |
利用上の注意 | ○クレジットなしでの利用 ○生成物の販売 ○有料生成サービスへの利用 ○マージモデルのシェア ×マージモデルの販売 ○マージモデルシェア時の制限変更 |
Pastel-Mix
Pastel-Mixは、パステル調の画風の美少女イラストを生成できるStable Diffusionモデルです。
現在配布されているイラスト系のモデルの大半は、アニメ調の塗りであるのに対して、Pastel-Mixは独特の画風になっています。
部屋にいる少女と三毛猫の画像をイラスト風に描いた画像を生成してみます。
[masterpiece, best quality, ultra-detailed, 1girl, illustration, calico cat, smile, room]
[傑作、最高品質、精細に、女の子1人、イラスト、三毛猫、笑顔、部屋]
ネガティブプロンプト
[(worst quality:2) , (low quality:2) , (normal quality:2) , lowres , bad anatomy , missing fingers , bad hands , monochrome , grayscale , watermark , bad legs , bad arms , mole]
[最悪の品質:2倍、低品質:2倍 、通常の品質:2倍 、低解像度、悪い構造、欠けている指、悪い手、モノクロ、グレースケール、透かし、悪い脚、悪い腕、ほくろ]
髪色や家具の指定をしなかったのですが、雰囲気に合った背景が生成されました。
License | creativeml-openrail-m |
利用上の注意 | ○クレジットなしでの利用 ○生成物の販売 ○有料生成サービスへの利用 ○マージモデルのシェア ×マージモデルの販売 ×マージモデルシェア時の制限変更 |
Stable Diffusionモデルの入れ方
Stable Diffusionモデルの入れ方を2つのサイト別に解説していきます。
Hugging Faceを利用する場合
今回はStable Diffusionの「SDXLのベース」をインストールするので「stable-diffusion-xl-base-1.0」を選択します。
「Files and versions」タブに移動後、ページ下部の「sd_xl_base_1.0.safetensors」を「download」ボタンをクリックしてダウンロードします。
ダウンロードしたモデルデータの拡張子は、「.safetensors」もしくは「.ckpt」で表示されています。
「
models」>「 Stable-diffusion」の順で開き、「 Stable-diffusion」の中に先ほどダウンロードした「○○.safetensors」ファイルを配置すれば完了です。Civitaiを利用する場合
サイトにユーザー登録してボタンから「.safetensors」ファイルをダウンロードします。
「
models」>「 Stable-diffusion」の順で開き、「 Stable-diffusion」の中に先ほどダウンロードした「○○.safetensors」ファイルを配置すれば完了です。Stable Diffusionモデルの使い方
Stable Diffusionのモデルは、画面左上の「checkpoint」と書かれている部分の下にある「▼」から選択し、切り替えることで適用されます。
Stable Diffusionモデルが読み込めない?
Stable Diffusionでモデルデータを利用すると、これまでスムーズだった画像生成に時間がかかることがあります。
Stable Diffusionモデルの導入に関しては、GPUメモリ(VRAM)16GB以上が推奨されています。
Stable Diffusionは。比較的簡単な画像であればノートPCでも生成が可能でしたが、モデルを利用すると大きく負荷が増すことになるので注意が必要です。
Stable Diffusionでモデルデータが読み込めない、エラーが発生した場合は下記の項目を参考に対処してみてください。
ブラウザを更新する
Stable Diffusionを表示しているブラウザを再読み込み[F5]してみましょう。
Stable Diffusion Web UIを再起動する
一度Stable Diffusion Web UIを閉じてwebui-user.batから起動し直してみましょう。
cache.jsonを削除してStable Diffusion Web UIを再起動
cacheファイルが増大していると起動が遅くなりますので、定期的に削除するのがおすすめです。
削除する際は、ソフトを閉じてから削除するか、削除後に再起動をするようにしましょう。
Stable Diffusionのモデルをもっと快適に使うには?
Stable Diffusionのモデルを使用しての画像生成を快適にするには、GPUのスペックが重要になってきます。
効率的にStable Diffusionのモデルを利用するには、16GB以上のVRAMが搭載されたパソコンの利用がおすすめです。
2024年10月現在、ラインナップでおすすめのパソコンはこちらです。
Stable Diffusionが快適に使えるおすすめのパソコンやグラボ関しては下記の記事で紹介しています。
【おすすめ】PICSOROBANですぐに快適利用!
コストを抑えたいと考えている方におすすめは、PICSOROBANです。
ブラウザで簡単!ピクソロ!
PICSOROBANは、インストールの必要なくブラウザで簡単にStable Diffusionを利用できます。
さらに、今ならリリースキャンペーンとして無料会員登録するだけで、2,000ポイント(約2時間分)貰えます!
詳しい使い方は下記の記事で紹介しています。
\今なら約2時間無料で使える!/
Stable Diffusionモデルを使うならPICSOROBANがおすすめ
Stable Diffusionモデルを使うとこでPC全体の動作が遅く感じたり、スペックやVRAM容量に不安があったりする場合は、PICSOROBANの利用がおすすめです。
PICSOROBANなら、30分約57円から利用できます!