Qwen ImageをComfyUIで使いこなそう！インストールから使い方まで徹底解説！

2025年8月18日

「Qwen Image」は、Alibaba Cloudが開発した画像生成AIです。日本語での指示を正確に理解し、高精度な画像を生成できる点から、今大きな注目を集めています。

そのポテンシャルを最大限に引き出すなら、ノードベースで柔軟なワークフローを組み立てられる「ComfyUI」との組み合わせが最適です。

この記事では、Qwen Imageのインストール方法から具体的な使い方までをわかりやすく解説します。

Qwen Imageとは

Qwen Imageは、Alibaba Cloudが開発したテキストから画像を生成するAIモデルです。

これまで多くの画像生成AIが苦手としてきた、画像内に自然で正確な文字（テキスト）を描画できる点に優れているのが大きな特徴です。

さらに、単に画像を生成するだけでなく、キャラクターのポーズ変更やスタイル変更といった高度な編集も行えます。

あわせて読みたい

TaylorSeerをComfyUIで使いこなそう！インストールから使い方まで徹底解説！ TaylorSeerは、FLUXなどの画像生成フレームワークを効率化サポートする生成AIツールです。生成速度の向上とVRAM消費を節約しながら品質を落とさずに画像生成ができます…

Stable Diffusionの使い方は、機能別に下記の記事にまとめているのでぜひご覧ください

あわせて読みたい

Stable Diffusionまとめ！プロンプトや使い方が丸わかり Stable Diffusionは、絵を描くスキルがなくても直感的に高品質な画像を生成できる画像生成AIです。この記事では、Stable Diffusionの基本的な使い方から具体的なプロン...

Qwen Imageのインストール手順

ここでは、Qwen Imageを利用するまでの手順を詳しく解説します。

今回は、ComfyUI上でのQwen Imageの使い方を解説します。

ComfyUIを起動するそれぞれの環境に合わせた手順を参考にして、スムーズにQwen Imageのセットアップを進めましょう。

ComfyUIをインストール

環境に合わせたインストール手順を参考にして、ComfyUIのセットアップを進めましょう。

WindowsPCにインストールする方法

STEP

GitHubでデータをダウンロード

まずは、GitHubのComfyUI公式ページにアクセスし、必要なデータをダウンロードします。

Windows PCの場合、GPUを搭載しているPC向けと、非搭載のPC向けに分かれているため、自身の環境に適したバージョンを選びましょう。

ページの中部の「Installing」の項目からComfyUIの圧縮ファイルを探します。

「Direct link to download」をクリックすると、データのダウンロードが開始します。

STEP

パッケージを解凍

データのダウンロードが完了するまで待ちます。
※ ファイルサイズは約1.3GBと比較的大きいので、安定したインターネット接続環境でのダウンロードをおすすめします。

ダウンロードが完了したらデータを解凍します。

ファイルは 7-zip の形式で圧縮されてますので、専用の圧縮・解凍ソフトの利用がおすすめです。

7-zip
https://7-zip.opensource.jp/

STEP

ComfyUIを起動

解凍後の「ComfyUI_windows_portable_nvidia_cu121_or_cpu」フォルダを開きます。この中にある「ComfyUI_windows_portable」がソフトウェアの本体です。

ファイル名が長すぎたり、日本語を含むディレクトリに配置すると、エラーが発生する可能性があります。そのため、シンプルでアクセスしやすい場所に移動することをおすすめします。

例: Cドライブ直下に「SD」というフォルダを作成し、その中に「ComfyUI_windows_portable」を移動。

設置が完了したら「run_nvidia_gpu.bat」をダブルクリックして、ソフトを起動します。

起動後、既定のブラウザが自動で開き、ComfyUIの画面が表示されます。

GPUSOROBANにインストールする方法

ここでは、インターネット上で高性能なGPUを利用できるクラウドサービス「GPUSOROBAN」にComfyUIをインストールする方法を解説します。

まず、GPUSOROBANを利用するために、会員登録からセットアップまでを完了させる必要があります。

詳しい手順については、以下のリンクをご参照してください。
GPUSOROBANの会員登録とセットアップ方法

STEP

インスタンスを起動してVSCODEでSSH接続

GPUSOROBAN起動チュートリアルに従い、インスタンスの起動とSSH接続を完了させます。

「user@<インスタンス名>:~$」が表示されたら、インスタンスへの接続が正常に完了したことを確認できます。

STEP

環境をセットアップ

次に、GPUSOROBANのGPUインスタンス内にComfyUI専用の環境を作成します。

今回はMinicondaのConda環境を使ってComfyUIをセットアップしていきます。

conda create -n comfy python=3.10
conda activate comfy
pip install torch==2.5.1+cu118 torchvision --extra-index-url https://download.pytorch.org/whl/cu118

ComfyUIの推奨バージョンはpython 3.10ですので、プロジェクト名を「Comfy」にしてGPUSOROBANのセットアップ通りに進めて完了すれば問題ありません。

STEP

ComfyUIのインストール

インスタンスを起動した状態でComfyUIをインストールします。

＄の後に以下のコマンドを入力します。

git clone https://github.com/comfyanonymous/ComfyUI.git

STEP

環境を切り替えて最新版に更新

先ほど構築したComfyUI専用環境に切り替えてComfyUI最新版をインストールします。

conda activate comfy
cd ComfyUI
pip install -r requirements.txt

STEP

ComfyUIを起動

次のコマンドを実行してComfyUIを起動します。

python main.py

デバイス上の割り当てが失敗して起動がうまく行かない場合は–disable-cuda-mallocのオプションを付けて起動します。

python main.py --disable-cuda-malloc

ブラウザで開くボタンをクリックして起動完了になります。

あわせて読みたい

ComfyUIのインストールから使い方まで徹底解説！ ComfyUIは、ノードベースのワークフローを自由に組むことができる生成AIツールです。プロセスの可視化や操作が直感的に行える点が大きな特徴で、カスタマイズ性にも優…

Qwen Imageの使い方

ここからはQwen Imageの基本的な使い方を解説していきます。

以下のステップで、まずは基本的な使い方をマスターしましょう。

STEP

Qwen Imageのワークフローを入手

Qwen ImageのワークフローをComfyUIの公式サンプルページから入手します。

ワークフローは画像の中に埋め込まれているので、画像をブラウザからそのままダウンロードします。

デモ画像
https://comfyanonymous.github.io/ComfyUI_examples/qwen_image/

ダウンロードした画像をComfyUIの画面にドラッグ＆ドロップで画像を読み込むと埋め込まれているワークフローデータを表示することができます。

STEP

Qwen Imageのモデルを入手する

Qwen Image専用の学習モデルデータをHugging Faceからダウンロードしてセットアップします。

基本モデルのダウンロード（19.03GB）

cd ComfyUI/models/diffusion_models wget https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/resolve/main/split_files/diffusion_models/qwen_image_fp8_e4m3fn.safetensors

CLIPモデルのダウンロード（9.38GB）

cd ComfyUI/models/clip wget https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/resolve/main/split_files/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors

VAEのダウンロード（254MB）

cd ComfyUI/models/vae wget https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/resolve/main/split_files/vae/qwen_image_vae.safetensors

Qwen Imageに必要なファイル一覧

モデル: qwen_image_fp8_e4m3fn.safetensors（19.03GB）
テキストエンコーダー: qwen_2.5_vl_7b_fp8_scaled.safetensors （9.38GB）
VAE: qwen_image_vae.safetensors（254MB）

STEP

画像生成を開始！

ComfyUIを起動して、Qwen Imageのワークフローファイルをドラッグ＆ドロップで読み込みます。

全てのノードが正常に反映されているか確認します。

導入前に「ComfyUI」を起動して最新版に更新しておきましょう。

ワークフローで指定された3つのノードにモデルデータをセットします。