Stability AI は、画像生成AI「Stable Diffusion」の最新版「Stable Diffusion 3」を2024年2月23日に発表しました。
今回のバージョンアップで、以前のバージョンと比較して画像生成を処理する能力が大幅に向上しています。
- 画像の生成に加えてテキストを埋め込みが可能に
- 一般公開に向けて早期アクセスへの待機リストを開設
- パラメータが選択できるオプションが追加され、ローエンドモデルPCでの利用も便利に
画像の生成に加えてテキストを埋め込みが可能に
この画像は以下のプロンプトを入力した結果で、今まで実現できなかった「画像内でのテキスト表記」が可能になっています。
プロンプト:Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy
Stability AI によると、Stable Diffusion3は、以前のバージョンと比較して、複数の被写体の画像生成を処理する能力が大幅に向上しています。
これにより、ユーザーは複数の要素を含むより詳細なプロンプトを含めることができ、より良い結果を得ることができます。
一般公開に向けて早期アクセスへの待機リストを開設
Stable Diffusion 3は、まだ一般には公開されていませんが、Stability AI は早期アクセスに興味がある人向けの待機リストを開設しました。
Stability AI はフィードバックを収集し、今年後半に予定されているリリースに向けて改善を進めていきます。
\待機リストへの申し込みはこちら/
パラメータが選択できるオプションが追加され、ローエンドモデルPCでの利用も便利に
Stable Diffusion 3 は、ローエンドの 8 億パラメータからハイエンドの 80 億パラメータまで、さまざまなモデルサイズで提供されます。
このオプションはクリエイティブなパフォーマンスと、さまざまな計算リソースを持つユーザーアクセスへのバランスを取ることを目的としていると発表されています。
この中にはOpenAI Soraにも使われている「拡散トランスフォーマー・アーキテクチャ」と「フロー・マッチング」という技術を組み合わせる新たな技術が導入されています。
Stability AIは、今回のアップデートで課題となっていた潜在的な害を軽減する機能も果たしていると言及しています。
Stable Diffusion 3は、飛躍的なバージョンアップ!
Stable Diffusion3は、従来のモデルと比較して大幅な品質向上が実現され、多くの新機能が提供されることになります。
ライバルであるDALL-E3との競争にも注目が集まりそうです。
Stability AIは、安全で責任あるAI実践を信じていると述べ、悪意のある者によるStable Diffusion3の利用を防ぐための合理的な措置を講じたとしております。
技術的な進化以外にも、AIが与える社会的な影響への解決にも期待して見ていきたいです。
出典:Stability AI