Stability AI がStable Diffusion3の先行プレビューを発表

(出典:stability.ai)

Stability AI は、画像生成AI「Stable Diffusion」の最新版「Stable Diffusion 3」を2024年2月23日に発表しました。

今回のバージョンアップで、以前のバージョンと比較して画像生成を処理する能力が大幅に向上しています。

このニュースのポイント
  • 画像の生成に加えてテキストを埋め込みが可能
  • 一般公開に向けて早期アクセスへの待機リストを開設
  • パラメータが選択できるオプションが追加され、ローエンドモデルPCでの利用も便利
目次

画像の生成に加えてテキストを埋め込みが可能に

(出典:stability.ai)

この画像は以下のプロンプトを入力した結果で、今まで実現できなかった「画像内でのテキスト表記」が可能になっています。

プロンプト:Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy

Stability AI によると、Stable Diffusion3は、以前のバージョンと比較して、複数の被写体の画像生成を処理する能力が大幅に向上しています。

(出典:stability.ai)

これにより、ユーザーは複数の要素を含むより詳細なプロンプトを含めることができ、より良い結果を得ることができます。

一般公開に向けて早期アクセスへの待機リストを開設

Stable Diffusion 3は、まだ一般には公開されていませんが、Stability AI は早期アクセスに興味がある人向けの待機リストを開設しました。

Stability AI はフィードバックを収集し、今年後半に予定されているリリースに向けて改善を進めていきます。

\待機リストへの申し込みはこちら/

パラメータが選択できるオプションが追加され、ローエンドモデルPCでの利用も便利に

(出典:stability.ai)

Stable Diffusion 3 は、ローエンドの 8 億パラメータからハイエンドの 80 億パラメータまで、さまざまなモデルサイズで提供されます。

このオプションはクリエイティブなパフォーマンスと、さまざまな計算リソースを持つユーザーアクセスへのバランスを取ることを目的としていると発表されています。

この中にはOpenAI Soraにも使われている「拡散トランスフォーマー・アーキテクチャ」と「フロー・マッチング」という技術を組み合わせる新たな技術が導入されています。

Stability AIは、今回のアップデートで課題となっていた潜在的な害を軽減する機能も果たしていると言及しています。

Stable Diffusion 3は、飛躍的なバージョンアップ!

Stable Diffusion3は、従来のモデルと比較して大幅な品質向上が実現され、多くの新機能が提供されることになります。

ライバルであるDALL-E3との競争にも注目が集まりそうです。

Stability AIは、安全で責任あるAI実践を信じていると述べ、悪意のある者によるStable Diffusion3の利用を防ぐための合理的な措置を講じたとしております。

技術的な進化以外にも、AIが与える社会的な影響への解決にも期待して見ていきたいです。

出典:Stability AI

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUB編集部からのお知らせ

無料ウェビナーのお知らせ

ソフトバンクSarashinaウェビナー

日本語LLM「Sarashina」& OCR機能「Phi-3 Vision」の 無料オンラインウェビナー!

開催日時:
2024年7月24日(水) 14:00~15:00

内容:

  • 「Sarashina」や「Phi-3 Vision」の概要と使い方の紹介
  • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

このウェビナーでは、ソフトバンクの日本語の強いの大規模言語モデル「Sarashina」の使い方や、実際にどのように使えるかを具体的に紹介します。

また、画像からテキストを抽出するOCR機能を簡単に作成できる「Phi-3 Vision」の使い方もデモを交えてお見せします。

生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

こんな方におすすめ!

  • 最新のAI技術やトレンドに興味がある方
  • AI開発に携わっている方
  • 生成AIの実用的な活用方法を学びたい方
  • 新しいツールや技術を積極的に取り入れたい方

\参加申し込みはこちら!/

この記事を書いた人

EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

目次