ComfyUI×Wan2.1 VACEで簡単動画生成！ローカル環境のセットアップと使い方を解説

2025年5月30日

Wan2.1 VACE（All-in-One Video Creation and Editing）は、アリババが2025年3月に公開したオープンソースの動画生成AI「Wan2.1」の最新バージョンです。

Wan2.1 VACEを使えば、動画の生成や編集を一つでこなすことができます。

この記事では、初心者にも分かりやすく、Wan2.1 VACEの概要とComfyUIを活用したローカル環境での導入・使い方を解説します。

Wan2.1 VACEとは？

Wan2.1 VACEは、VACEは動画生成や編集をとても細かくコントロールでき、いろいろな入力データを組み合わせて、自由度の高いビデオ制作ができる先進的なAIモデルです。

VACEの特徴は、これまで複数のツールやモデルを使い分ける必要があった作業（テキストからの動画生成、画像を参考にした動画生成、動画編集、動画の拡張など）が、VACE一つで簡単にできるという点です。

ユーザーは無駄な手間なく、より自由にアイデアを形にできるようになり、動画制作の創造力と効率が大きくアップします。

Wan2.1 VACEの主な特徴は下記の3つです。

Wan2.1 VACEの特徴

人のポーズや動き、構造、空間的な動き、色合いなどを自由に調整しながら動画を生成
生成した後でもキャラクターのポーズや動き、背景のレイアウトなどを変更が可能
オープンソースモデルで、無料で利用可能

VACEは、動画の作成と編集のためのオールインワンモデル

VACEは、リファレンスを元に動画を生成する「R2V（Reference-to-Video）」、既存の動画を編集する「V2V（Video-to-Video）」、特定の部分だけを編集する「MV2V（Masked Video-to-Video）」といった多様なタスクに対応しています。

自由にタスクを組み合わせて多様な可能性を探求し、効率的にワークフローを進めることができます。

「Move-Anything（何でも動かす）」「Swap-Anything（何でも入れ替える）」「Reference-Anything（何でも参照する）」「Expand-Anything（何でも拡張する）」「Animate-Anything（何でもアニメーション化する）」など、幅広い機能を提供します。

革新的な「ビデオ条件ユニット（VCU）」

Wan2.1 VACEは、ビデオ編集において特定領域の置き換え・追加・削除だけでなく、フレームを基に時間軸を補完する機能や背景の拡張・変更も可能です。

特に注目すべきは、画像や動画をアップロードし、それに運動姿勢、光フロー、深度マップなどの制御信号を組み合わせることで、部分的な映像の再描画や主体の置換を可能にする機能です。

この機能の大きな特徴は、Stable DiffusionのControlNetが画像編集で実現している高度な編集機能を、そのまま動画編集にも応用できる点です。

テキストからビデオ生成、ポーズコントロール、背景変更などを一つのモデルで行えるため、従来のように個別のモデルをトレーニングする必要がありません。

オープンソースモデルで、無料で利用することができる

Wan2.1 VACEは、Apache 2.0ライセンスのもとで公開されており、無料で利用可能です。

Wan2.1 VACEはローカル環境、クラウド環境、ComfyUIで動作可能で、多様な利用シナリオに対応していて、カスタマイズや独自用途への適用が容易です。

オープンソース化により、学術研究者や企業が初期費用を抑えつつ、高品質な動画生成技術をプロジェクトに統合できます。

あわせて読みたい

「Wan2.1」ローカル環境の使い方！ ComfyUIで動画生成に挑戦！ Wan2.1は、アリババが2025年3月に公開したオープンソースの動画生成AIです。 Wan2.1を使えば、テキストプロンプトや画像を入力するだけで、高品質な動画を簡単に作成で…

Stable Diffusionの使い方は、機能別に下記の記事にまとめているのでぜひご覧ください

あわせて読みたい

Stable Diffusionまとめ！プロンプトや使い方が丸わかり Stable Diffusionは、絵を描くスキルがなくても直感的に高品質な画像を生成できる画像生成AIです。この記事では、Stable Diffusionの基本的な使い方から具体的なプロン...

Wan2.1 VACE ComfyUIでの始め方・使い方

ここでは、「ComfyUI」を使ったローカル環境での「Wan2.1 VACE」の始め方から使い方まで紹介します。

ComfyUIの導入方法はこちらの記事で詳しく解説しています。

あわせて読みたい

ComfyUIのインストールから使い方まで徹底解説！ ComfyUIは、ノードベースのワークフローを自由に組むことができる生成AIツールです。プロセスの可視化や操作が直感的に行える点が大きな特徴で、カスタマイズ性にも優…

STEP

Wan2.1 のプロジェクトをインストール

Wan2.1 VACEは、多くのGPUパワーが必要になりますので、余裕をもって準備をしておきましょう。

最初にベースとなるWan2.1 専用の環境を設定します。

同じPC内で異なるプログラムのバージョンを利用するには、ソフト専用の環境を作ります。そうすることでパッケージの競合を防ぐことができます。

ここでは、conda環境を利用して整えます。

下記のコマンドを入力して環境を新規で構築します。

conda create -n Wan python=3.10
conda activate Wan
pip install torch==2.5.1+cu118 torchvision --extra-index-url https://download.pytorch.org/whl/cu118

環境の設定が完了したらデータのインストールに進みます。

「ComfyUI」>「custom_nodes」を開き、下記のコマンドを入力してComfyUI用のWan2.1 VACEプロジェクトをインストールします。

cd ComfyUI/custom_nodes
git clone https://github.com/kijai/ComfyUI-WanVideoWrapper.git

「ComfyUI-WanVideoWrapper」を開き、依存関係を取り除く追加データを入手します。

cd ComfyUI/custom_nodes/ComfyUI-WanVideoWrapper
pip install -r requirements.txt

STEP

モデルデータを入手する

次に、動画を生成するためのモデルデータを入手します。

動画生成に必要なモデルデータは下記の3つです。

動画のモデルデータ
VAE
CLIP

動画のモデルデータ

動画のモデルデータをHugging Faceからダウンロードします。

wan2.1_vace_1.3B_fp16.safetensors（4.31 GB）

最初は軽量版の「wan2.1_vace_1.3B_fp16.safetensors」を使用します。

「ComfyUI」>「models」>「diffusion_models」を開き、下記のコマンドを入力して動画のモデルデータをダウンロードして配置します。

cd ComfyUI/models/diffusion_models
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/blob/main/split_files/diffusion_models/wan2.1_vace_1.3B_fp16.safetensors

VAE

次にVAEのモデルデータをHugging Faceからダウンロードします。

wan_2.1_vae.safetensors（254 MB）

「ComfyUI」>「models」>「vae」を開き、下記のコマンドを入力してVAEのモデルデータをダウンロードして配置します。

cd ComfyUI/models/vae
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/blob/main/split_files/vae/wan_2.1_vae.safetensors

CLIP

最後にCLIPデータをHugging Faceからダウンロードします。

umt5_xxl_fp8_e4m3fn_scaled.safetensors（6.74GB）

「ComfyUI」>「models」>「text_encoders」を開き、下記のコマンドを入力してCLIPデータフォルダにダウンロードして配置します。

cd ComfyUI/models/clip
wget https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/blob/main/split_files/text_encoders/umt5_xxl_fp8_e4m3fn_scaled.safetensors

STEP

「ComfyUI」を起動してワークフローを開く

今回は公式で配布されている総合ワークフローを使用します。

ワークフローデータは、公式に公開されているサンプルファイル（動画ファイル）を右クリック後にダウンロードして使用します。