Stable Diffusionモデルとは? 一覧とその特徴を紹介

Stable Diffusionモデルとは? 一覧とその特徴を紹介

Stable Diffusionは、モデルを利用することで細かなスタイルや雰囲気を学習し、高品質な画像を簡単に生成することができます。

この記事では、Stable Diffusionでのモデルの使い方や特徴を解説していきます。

目次

Stable Diffusionモデルとは?

AIイラスト桜と美少女

Stable Diffusionのモデルとは、Stable Diffusionに学習させるデータセットのことを指します。

モデルを活用すると、一からプロンプト入力しなくても、モデルに応じた細かなスタイルや雰囲気などを活用でき、AI画像を生成しやすくなります。

例えば、アニメ系のモデルを導入すれば、プロンプトでスタイルを指定しなくてもアニメイラスト画像が生成されます。

また、既存のモデルデータを組み合わせてオリジナルデータ(マージ)を作成することも可能です。

Stable Diffusionモデル一覧とその特徴

煌めきのイメージの見出し画像

Stable Diffusionのモデルは、配布されているサイトからダウンロードすることができます。

ここからは、カテゴリー別にStable Diffusionモデルのおすすめを紹介していきます。

Stable Diffusion実写・リアル系人気モデル

主に実写に近いリアルな画像生成する際に利用されるStable Diffusionモデルを紹介します。

SDXL -base-1.0

SDXLは、Stable Diffusion XLの略で、Stable Diffusionの開発元であるStability AI社が提供するモデルです。

実際にSDXLで画像を生成してみます。

公園で長い黒髪の美しい日本の女の子が立っている画像を生成したいと思います。

SDXL
使用したプロンプト

[(masterpiece),((ultra-detailed)), (ultra highres), (best quality:1.2), solo, beautiful japanese girl ,smile, (pink kimono:1.2), Portrait , perfect face, sidelighting, lustrous skin, lighting, ray tracing, perfect anatomy , beautiful eyes,shiny,glittering,color,sparkle,glitter,shine,glow,effect, long black hair , standing, park]

[傑作、超詳細に、超高解像度、最高品質:1.2倍、ソロ、美しい日本の女の子、ピンクの着物、笑顔、ポートレート、完璧な顔、サイドライト、光沢のある肌、ライティング、レイトレーシング、整った体型、美しい目、光沢のある、キラキラしている、色、輝き、キラキラ、効果、長い黒髪、立ち姿、公園]

ネガティブプロンプト

[negativeXL_D, ((missing fingers , bad hands , bad anatomy:1.3)) , monochrome , grayscale , watermark , bad legs , bad arms , molebad hands ,(deformed, distorted, disfigured:1.3), ugly, noisy, blurry, (worst quality, low quality, normal quality, bad quality:1.4) , close up, zoomed in,cartoon, ((disfigured)), ((bad art)), ((deformed)), ((poorly drawn)), ((extra limbs)), weird colors, blurry]

[negativeXL_D、欠けている指、悪い手、悪い解剖学:1.3倍、モノクロ、グレースケール、透かし、悪い足、悪い腕、モグラ悪い手、変形、歪み、外観の変化:1.3倍、醜い、うるさい、ぼやけている、最悪品質、低品質、通常の品質、悪い品質:1.4倍 、クローズアップ、ズームイン、漫画、醜い、ひどいアート、下手に描かれた、余分な手足、奇妙な色]

きめ細かさが特徴のモデルだけあって、細部まで繊細な画像が生成できました。

LicenseCreativeML Open RAIL++-M License
利用上の注意○クレジットなしでの利用
×生成物の販売
○有料生成サービスへの利用
○マージモデルのシェア
×マージモデルの販売
×マージモデルシェア時の制限変更
(2024年6月の情報)

PicX_real

PicX_realは、リアル風(実写)の画像生成に特化したStable Diffusionモデルです。

AI美女をStable Diffusionで生成してみたい人におすすめです。

フードを被った日本のアイドル風の少女を生成してみます。

PicX_real
使用したプロンプト

[(masterpiece, raw photo, ultra quality), absurdres, (photo realistic:2), high quality, best quality,high detail raw color photo,skiny skin, professional photograph,Beautiful japanese idol girl, solo, look at viewer, hoodie, upper half of the body, insanely detailed, 4K, studio background, necklace]

[傑作、生写真、超高画質、非日常的な、フォトリアル:2倍、高画質、最高画質、ハイディテール生カラー写真、美肌、プロ写真、日本の美少女アイドル、ソロ、カメラ目線、パーカー、上半身、非常に詳細、4K、スタジオの背景、ネックレス]

ネガティブプロンプト
[(worst quality:2) , (low quality:2) , (normal quality:2) , lowres , bad anatomy , missing fingers , bad hands , monochrome , grayscale , watermark , bad legs , bad arms , mole]

[最悪の品質:2倍、低品質:2倍 、通常の品質:2倍 、低解像度、悪い構造、欠けている指、悪い手、モノクロ、グレースケール、透かし、悪い脚、悪い腕、ほくろ]

リアルな可愛いAI美女を生成することができました。

LicenseCreativeML Open RAIL-M
利用上の注意○クレジットなしでの利用
×生成物の販売
×有料生成サービスへの利用
×マージモデルのシェア
×マージモデルの販売
○マージモデルシェア時の制限変更
(2024年4月の情報)

Stable Diffusionイラスト・アニメ系人気モデル

次はイラストやアニメ系のStable Diffusionモデルを紹介します。

Anythingシリーズ

Anythingシリーズは、イラスト生成のStable Diffusionモデルの中で最も有名なモデルです。

高品質が大きな特徴で、アニメ塗りで生成される絵の完成度はとても高いです。

これまでAnything V5が主流でしたが、2024年3月に新たにXLがリリースされたので、今回はその新しいAnything XLを利用して、魔法使いの少女の絵を生成してみたいと思います。

Anything XL
使用したプロンプト

[(masterpiece),((ultra-detailed)), (highly detailed CG illustration), (best quality:1.2), solo, anime, 1girl,smile,((Black hair color:1.5)), Portrait ,(full body :1.1), perfect face, sidelighting, lustrous skin, lighting, ray tracing, perfect anatomy , dressed in black formal clothes , girl wizard using magic,beautiful eyes,god gesture,glittering,color,sparkle,glitter, in school class room]

[傑作,超詳細に, 高精細CGイラスト, 最高品質:1.2倍, ソロ, アニメ, 1人, 笑顔,黒髪:1.5倍, ポートレート,全身: 1.1倍、完璧な顔、サイドライト、光沢のある肌、照明、レイトレーシング、完璧な体型、黒いフォーマルな服、魔法を使用する女の子の魔法使い、美しい目、神のジェスチャー、光沢のある、色、輝き、キラキラ、学校の教室]

ネガティブプロンプト
[nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name]

[不適切なコンテンツ、低解像度、悪い構造、悪い手、テキスト、エラー、指が欠けている、余分な指、指の本数が少ない、切り取られている、最悪の品質、低品質、通常の品質、JPEG圧縮のアーティファクト、署名、ウォーターマーク、ユーザー名、ぼやけている、アーティスト名]

LicenseCreativeML Open RAIL++-M
利用上の注意○クレジットなしでの利用
○生成物の販売
○有料生成サービスへの利用
○マージモデルのシェア
×マージモデルの販売
○マージモデルシェア時の制限変更
(2024年4月の情報)

Pastel-Mix

Pastel-Mixは、パステル調の画風の美少女イラストを生成できるStable Diffusionモデルです。

現在配布されているイラスト系のモデルの大半は、アニメ調の塗りであるのに対して、Pastel-Mixは独特の画風になっています。

部屋にいる少女と三毛猫の画像をイラスト風に描いた画像を生成してみます。

Pastel
使用したプロンプト

[masterpiece, best quality, ultra-detailed, 1girl,  illustration, calico cat, smile, room]

[傑作、最高品質、精細に、女の子1人、イラスト、三毛猫、笑顔、部屋]

ネガティブプロンプト
[(worst quality:2) , (low quality:2) , (normal quality:2) , lowres , bad anatomy , missing fingers , bad hands , monochrome , grayscale , watermark , bad legs , bad arms , mole]

[最悪の品質:2倍、低品質:2倍 、通常の品質:2倍 、低解像度、悪い構造、欠けている指、悪い手、モノクロ、グレースケール、透かし、悪い脚、悪い腕、ほくろ]

髪色や家具の指定をしなかったのですが、雰囲気に合った背景が生成されました。

Licensecreativeml-openrail-m
利用上の注意○クレジットなしでの利用
○生成物の販売
○有料生成サービスへの利用
○マージモデルのシェア
×マージモデルの販売
×マージモデルシェア時の制限変更
(2024年4月の情報)

Stable Diffusionモデルの入れ方

AIイラスト美少女

Stable Diffusionモデルの入れ方を2つのサイト別に解説していきます。

Hugging Faceを利用する場合

STEP
Hugging Faceへアクセス

まずは、Hugging Faceサイトにアクセスします。

その後、「Modelsタブ」を選択してモデル名を検索します。

Hugging Face
(出典:huggingface.co)
STEP
モデルを決めてダウンロード

今回はStable Diffusionの「SDXLのベース」をインストールするので「stable-diffusion-xl-base-1.0」を選択します。

Hugging Face
(出典:huggingface.co)

「Files and versions」タブに移動後、ページ下部の「sd_xl_base_1.0.safetensors」を「download」ボタンをクリックしてダウンロードします。

ダウンロードしたモデルデータの拡張子は、「.safetensors」もしくは「.ckpt」で表示されています。

Hugging Face
(出典:huggingface.co)

モデルによっては、いくつかのバージョンがありますで、自分のStable Diffusionのバージョンに合わせてダウンロードしましょう。

STEP
Stable Diffusionにモデルを入れる

models」>「Stable-diffusion」の順で開き、「Stable-diffusion」の中に先ほどダウンロードした「○○.safetensors」ファイルを配置すれば完了です。

Hugging Face

Civitaiを利用する場合

STEP
Civitaiサイトにアクセス

Civitaiサイトにアクセスします。

検索窓からモデルを検索します。今回は「Anything v5 ink」をダウンロードします。

Civitai
(出典:civitai.com)
STEP
ユーザー登録をする

サイトにユーザー登録してボタンから「.safetensors」ファイルをダウンロードします。

Civitai
(出典:civitai.com)
STEP
Stable Diffusionにモデルを入れる

models」>「Stable-diffusion」の順で開き、「Stable-diffusion」の中に先ほどダウンロードした「○○.safetensors」ファイルを配置すれば完了です。

Hugging Face

Stable Diffusionモデルの使い方

Stable Diffusionのモデルは、画面左上の「checkpoint」と書かれている部分の下にある「▼」から選択し、切り替えることで適用されます。

Stable Diffusion Web UI
(出典:Stable Diffusion Web UI)

Stable Diffusionモデルが読み込めない?

注意を促す見出し画像

Stable Diffusionでモデルデータを利用すると、これまでスムーズだった画像生成に時間がかかることがあります。

Stable Diffusionモデルの導入に関しては、GPUメモリ(VRAM)16GB以上が推奨されています。

Stable Diffusionは。比較的簡単な画像であればノートPCでも生成が可能でしたが、モデルを利用すると大きく負荷が増すことになるので注意が必要です。

Stable Diffusionでモデルデータが読み込めない、エラーが発生した場合は下記の項目を参考に対処してみてください。

ブラウザを更新する

Stable Diffusionを表示しているブラウザを再読み込み[F5]してみましょう。

Stable Diffusion Web UIを再起動する

一度Stable Diffusion Web UIを閉じてwebui-user.batから起動し直してみましょう。

cache.jsonを削除してStable Diffusion Web UIを再起動

cacheファイルが増大していると起動が遅くなりますので、定期的に削除するのがおすすめです。

削除する際は、ソフトを閉じてから削除するか、削除後に再起動をするようにしましょう。

Stable Diffusionのモデルをもっと快適に使うには?

快適のイメージ見出し画像

Stable Diffusionのモデルを使用しての画像生成を快適にするには、GPUのスペックが重要になってきます。

効率的にStable Diffusionのモデルを利用するには、16GB以上のVRAMが搭載されたパソコンの利用がおすすめです。

2024年7月現在、ラインナップでおすすめのパソコンはこちらです。

Stable Diffusionが快適に使えるおすすめのパソコンやグラボ関しては下記の記事で紹介しています。

【おすすめ!】クラウドGPUでコストを抑えて快適に利用

コストを抑えたいと考えている方におすすめは、クラウドGPUです。

クラウドGPUとは、インターネット上で高性能なパソコンを借りるようなものです。

GPUSOROBAN

GPUSOROBAN

GPUSOROBANは、高性能なGPU「NVIDIA A4000 16GB」を業界最安値の1時間50円で使用することができます。

さらに、クラウドGPUを利用しない時は停止にしておくことで、停止中の料金はかかりません。

クラウドGPUを使えばいつでもStable Diffusionの性能をフルに引き出すことができるので、理想の環境に近づけることができます。

\快適に生成AI!1時間50円~/

Stable Diffusionモデルを使うならクラウドGPUがおすすめ

Stable Diffusionモデルを使うとこでPC全体の動作が遅く感じたり、スペックやVRAM容量に不安があったりする場合は、GPUの増設やクラウドGPUの利用がおすすめです。

GPUSOROBANなら、1時間50円からレンタルできます!

GPUSOROBAN
https://soroban.highreso.jp/

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUB編集部からのお知らせ

無料ウェビナーのお知らせ

ソフトバンクSarashinaウェビナー

日本語LLM「Sarashina」& OCR機能「Phi-3 Vision」の 無料オンラインウェビナー!

開催日時:
2024年7月24日(水) 14:00~15:00

内容:

  • 「Sarashina」や「Phi-3 Vision」の概要と使い方の紹介
  • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

このウェビナーでは、ソフトバンクの日本語の強いの大規模言語モデル「Sarashina」の使い方や、実際にどのように使えるかを具体的に紹介します。

また、画像からテキストを抽出するOCR機能を簡単に作成できる「Phi-3 Vision」の使い方もデモを交えてお見せします。

生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

こんな方におすすめ!

  • 最新のAI技術やトレンドに興味がある方
  • AI開発に携わっている方
  • 生成AIの実用的な活用方法を学びたい方
  • 新しいツールや技術を積極的に取り入れたい方

\参加申し込みはこちら!/

この記事を書いた人

EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

目次