「FLUX.1」ローカル環境の使い方!Stable Diffusion WebUI ForgeやComifyUIで画像生成

Black Forest Labsは、2024年8月に画像生成AIモデルの最新バージョンである「FLUX.1」をリリースしました。

Flux(フラックス)とは、Stable DiffusionやComifyUIなどで利用できる画像生成AIのベースモデルです。

この記事では、「FLUX.1」ローカル環境の使い方を初心者向けに詳しく解説します。

リリース記念、2,000Ptプレゼント!

目次

FLUX.1とは?

flux.1
(出典:blackforestlabs.ai)

FLUX.1は、Stable Diffusion 3 のリリース後に離れたチーム「Black Forest Labs」によって開発された、テキストや画像を生成することができるAIサービスです。

その性能は、Stable Diffusion 3 を凌駕しMidjourneyに匹敵するクオリティです。

FLUX.1の大きな特徴は、下記の3つです。

FLUX.1の特徴
  • Stable Diffusion をベースとした生成能力とパフォーマンスのバランスがいい!
  • オープンソースとして利用が可能で、デベロッパーやコミュニティが豊富!
  • 120億ものパラメータを誇り、高画質+高品質で業界水準が高い!

Stable Diffusion をベースとした生成能力とパフォーマンスのバランスがいい!

FLUX.1は、Stable Diffusionの開発者が設立した「Black Forest Labs」が提供している生成モデルです。

Stable Diffusionの最新ベースモデルとして扱われる「FLUX.1」は、Stable Diffusion 3の経験を踏まえた最新バージョンにあたります。

Stable Diffusionと同様の使い方で、より詳細な描写と高速な処理が可能となっています。

オープンソースとして利用が可能で、デベロッパーやコミュニティが豊富!

FLUX.1は、従来のStable Diffusionと同じくオープンソースであり、実用性が高いローカル利用が可能な設計です。

FLUX.1は、Schnell[軽量版]からProまで異なる特性を持つ3つのバージョンが提供されています。

それぞれのモデルの概要は以下の通りです。

モデル商用利用提供プラットフォーム
FLUX.1 SchnellHugging Face、GitHub、Replicate、fal.ai、mystic、deepinfra
FLUX.1 Dev要問合せHugging Face、Replicate、fal.ai、mystic、deepinfra
FLUX.1 ProReplicate、fal.ai、mystic

120億のパラメータを誇り、高画質+高品質で業界水準が高い!

FLUX.1は、従来の画像生成AIで見かける不自然な表現が大幅に抑制され、品質が大きく向上しています。

品質面で遅れていたStable Diffusion 3は、FLUX.1の登場によりMidjourneyなどの他の画像生成AIサービスに大きく差をつけられたと評価されています。

スポンサーリンク

FLUX.1 Stable Diffusion WebUI Forgeでの始め方・使い方

現在、FLUX.1は「Stable Diffusion WebUI Forge」、「ComfyUI」などの環境で利用が可能です。

ここからは、「Stable Diffusion WebUI Forge」上でのFLUX.1の始め方から使い方まで紹介します。

STEP
「Stable Diffusion WebUI Forge」を使って生成

FLUX.1は、従来のモデルよりも多くの容量が必要になりますので、余裕をもって準備をしておきましょう。

まずは「Stable Diffusion WebUI Forge」を起動します。

FLUX.1が搭載された学習モデルのデータをHugging Faceからダウンロードしてセットします。

今回の生成に使用するファイルは下記の4つです。

①モデル: flux1-dev.safetensors (23.8GB)
②テキストエンコーダー: t5xxl_fp16.safetensors (9.79GB)
③クリップ: clip_l.safetensors
④VAE: ae.safetensors

  • ①モデル: flux1-dev.safetensors (23.8GB)

https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main

(出典:https://huggingface.co/)
  • ②テキストエンコーダー: t5xxl_fp16.safetensors (9.79GB)
  • ③クリップ: clip_l.safetensors

https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main

(出典:https://huggingface.co/)
  • ④VAE: ae.safetensors

https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main

(出典:https://huggingface.co/)
STEP
モデルデータをセット

ダウンロードしたデータをフォルダにセットします。

Stable Diffusion WebUI Forgeを「📁models」>「📁Stable Diffusion」の順で開き、先ほどダウンロードした「①flux1-dev.safetensors」を配置します。

続いて「②t5xxl_fp16.safetensors」「③clip_l.safetensors」「④ae.safetensors」 を「📁models」>「📁VAE」の順で開き、それぞれ配置します。

STEP
モデルを選択

データのセットが完了したらStable Diffusion WebUI Forgeを開いてFLUX.をセットします。

トップ画面左上のUIにfluxに切り替えるボタンがあるので、fluxを選択します。

続いてcheckpointを「flux1-dev.safetensors」、VAEに「t5xxl_fp16.safetensors」「clip_l.safetensors」「ae.safetensors」の3つを選択します。

VAEは、一つでも足りないと生成時にエラーが出てしまうので、忘れないようにしましょう。

STEP
生成開始!

2024年9月1日現在、Stable Diffusion WebUI Forgeで利用する「FLUX」は、ネガティブプロンプトが入力できないようになっています。

無理に入力することもできますが、生成結果はノイズとなってしまいます。

今回は、プロンプトだけを入力して画像を生成します。

使用したプロンプト

(masterpiece),((ultra-detailed)), (highly detailed CG illustration), (best quality:1.2), fringe, (lady:1.1), (reflection:1), (silhouette:1), One girl, alone, In a messy room,8K quality, watercolor painting, stylish design, (((The strongest beautiful girl of all time))), (((Japanese))),Idol,clear, Stylish sunglasses, Fashionable hats, (((highest quality))), bob hair, Place your hands on the wall, HDR, ((Detailed details)), stylish fashion, detailed clothing texture, (((graffiti art))), colorful hair, ((Super detailed)),(((colorful flowers)))

FLUX.1(Stable Diffusion WebUI Forge)で生成した画像

FLUX.1のおすすめモデルは次の記事で紹介しておりますので、よろしければご覧ください。

FLUX.1 ComifyUIでの始め方・使い方

見出し画像

ここでは、「ComfyUI」上でのFLUX.1の始め方から使い方まで紹介します。

STEP
「ComfyUI」を使って生成

FLUX.1は、従来のモデルよりも多くの容量が必要になりますので、余裕をもって準備をしておきましょう。

まずは「ComfyUI」を起動します。

FLUX.1が搭載された学習モデルのデータをHugging Faceからダウンロードしてセットします。

「ComfyUI」での生成に使用するファイルは下記の4つです。

①モデル: flux1-schnell.safetensors (23.8GB)
②テキストエンコーダー: t5xxl_fp8_e4m3fn.safetensors (4.89GB)
③クリップ: clip_l.safetensors
④VAE: ae.safetensors

  • モデル: ①flux1-schnell.safetensors (23.8GB)
  • ④VAE: ae.safetensors

https://huggingface.co/black-forest-labs/FLUX.1-schnell/tree/main

(出典:https://huggingface.co/)
  • テキストエンコーダー: ②t5xxl_fp8_e4m3fn.safetensors (4.89GB)
  • クリップ:③ clip_l.safetensors

https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main

(出典:https://huggingface.co/)
STEP
モデルデータをセット

ダウンロードしたデータをフォルダにセットします。

Stable Diffusion WebUI とは一部セットするフォルダが異なりますので注意しましょう。

ComfyUIを「📁models」>「📁unet」の順で開き、先ほどダウンロードした「flux1-schnell.safetensors」を配置します。

続いて「📁models」>「📁clip」の順で開き、先ほどダウンロードした「t5xxl_fp8_e4m3fn.safetensors 」、「clip_l.safetensors」を配置します。

続いて「ae.safetensors」 を「📁models」>「📁vae」の順で開き配置します。

STEP
ワークフローを設定

データのセットが完了したらComfyUIを起動してFLUX用のワークフローをセットします。

ワークフローをコピーするために公式サイトからデモ画像をダウンロードします。

https://comfyanonymous.github.io/ComfyUI_examples/flux

(出典:comfyanonymous.github.io)

ダウンロードした画像をComfyUIの画面にドラッグ&ドロップで画像を読み込むと埋め込まれているワークフローデータを表示することができます。

STEP
パラメータを設定して生成開始!

ComfyUIの生成開始画面で、各種パラメータを変更していきます。

UNETローダー

・UNETの名にflux1-schnell.safetensorsを選択します

デュアルCLIPローダー
・CLIP1に「t5xxl_fp8_e4m3fn.safetensors」を選択します
・CLIP2に「clip_l.safetensors」を選択します

VAEローダー

・VAE名に「ae.safetensors」を選択します。

CLIPテキストエンコーダー

・プロンプトを入力します。

※ネガティブプロンプトは入力しません。

画像サイズはデフォルトの1024×1024、その他のパラメータはデフォルトのまま生成を開始します。

生成は右上の「Queue Prompt」ボタンをクリックします。

使用したプロンプト

(raw photo, ultra quality),(photo realistic:2),stairs,flower,house,scenery,(top-quality,ultra high res,ultra detailed),beautiful illustration,perfect lighting,natural lighting,depth of fields,surrealism,beautiful detailed hair,beautiful detailed face,beautiful detailed eyes,beautiful clavicle,beautiful body,beautiful chest,beautiful thigh,beautiful legs,beautiful fingers,looking at viewer,1girl,blue eyes,bangs,earrings, She wears floral-print earrings and has pink lips,long hair wavy and has a floral print, wearing a pink shirt with a white floral print,looking at the viewer with closed mouth,wavyhair,eyelashes and jewelry on

FLUX.1(ComfyUI)で生成した画像

FLUX.1の料金プランと商用利用は?

料金イメージの見出し画像

FLUX.1 の料金プラン

FLUX.1 は、ローカル環境での使用範囲では無料で利用できます。

ただし、API経由での利用は、すべてのモデルが有料になります。

モデル料金商用利用提供利用されている環境
FLUX.1 Schnell無料API, ローカル環境
FLUX.1 Dev無料モデルの商用利用は不可ローカル環境
FLUX.1 Pro約0.05ドル/1枚API, Replicate, fal.ai

ローカル環境で利用する場合は、「Schnell」が軽減された容量内で利用できるのでおすすめです。

API経由で利用する場合は、Black Forest Labs社が提携しているパートナーにのみ提供されているため、「Replicate「fal.ai」のサービスサイトに登録してから利用することになります。

FLUX.1の商用利用は?

FLUX.1 での商用利用は利用するモデルによって異なります。

生成された画像は、全てのモデルにおいて商用利用が可能です。

モデル自体の商用利用は、FLUX.1 Devのみ不可となっています。

FLUX.1 Pro公式APIドキュメント
https://docs.bfl.ml/

スポンサーリンク

FLUX.1を使いこなして生成AIをマスターしよう!

今回は、Black Forest Labsが公開したStable Diffusionの最新モデル「FLUX.1」の使い方について紹介しました。

FLUX.1は、従来の画像生成サービスと比較して、最もクオリティが高い画像を生成することができます!

無料で利用できる動画生成AIサービスの中でトップクラスなので、このチャンスに高性能ツールで画像生成を極めてみましょう。

GPUSOROBAN
https://soroban.highreso.jp/

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUBロゴ

メールマガジン登録

Stable Diffusion・LLM・RAGに関する最新情報をいち早くお届けします。

無料メルマガの配信をご希望の方は、下記フォームよりご登録ください。

    EdgeHUB編集部からのお知らせ

    無料ウェビナーのお知らせ

    11/27ウェビナー

    RAG×日本語LLMの無料オンラインウェビナー第2弾!

    開催日時:
    2024年11月27日(水) 14:00~15:00

    内容:

    • 「LlamaIndex」と「Llama-3.1-Swallow」でRAG環境を構築
    • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

    このウェビナーでは、オープンソース「LlamaIndex」で構築したRAGの使い方や、デモを紹介します。

    生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

    こんな方におすすめ!

    • 日本語LLMの利用を検討している方
    • AI開発に携わっている方
    • 最新のAI技術やトレンドに興味がある方
    • GPUスペック不足に悩んでいる方

    \簡単1分で申し込み!/

    この記事を書いた人

    EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

    目次