Stability AI がStable Diffusion3の先行プレビューを発表

(出典:stability.ai)

Stability AI は、画像生成AI「Stable Diffusion」の最新版「Stable Diffusion 3」を2024年2月23日に発表しました。

今回のバージョンアップで、以前のバージョンと比較して画像生成を処理する能力が大幅に向上しています。

このニュースのポイント
  • 画像の生成に加えてテキストを埋め込みが可能
  • 一般公開に向けて早期アクセスへの待機リストを開設
  • パラメータが選択できるオプションが追加され、ローエンドモデルPCでの利用も便利
目次

画像の生成に加えてテキストを埋め込みが可能に

(出典:stability.ai)

この画像は以下のプロンプトを入力した結果で、今まで実現できなかった「画像内でのテキスト表記」が可能になっています。

プロンプト:Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy

Stability AI によると、Stable Diffusion3は、以前のバージョンと比較して、複数の被写体の画像生成を処理する能力が大幅に向上しています。

(出典:stability.ai)

これにより、ユーザーは複数の要素を含むより詳細なプロンプトを含めることができ、より良い結果を得ることができます。

一般公開に向けて早期アクセスへの待機リストを開設

Stable Diffusion 3は、まだ一般には公開されていませんが、Stability AI は早期アクセスに興味がある人向けの待機リストを開設しました。

Stability AI はフィードバックを収集し、今年後半に予定されているリリースに向けて改善を進めていきます。

\待機リストへの申し込みはこちら/

パラメータが選択できるオプションが追加され、ローエンドモデルPCでの利用も便利に

(出典:stability.ai)

Stable Diffusion 3 は、ローエンドの 8 億パラメータからハイエンドの 80 億パラメータまで、さまざまなモデルサイズで提供されます。

このオプションはクリエイティブなパフォーマンスと、さまざまな計算リソースを持つユーザーアクセスへのバランスを取ることを目的としていると発表されています。

この中にはOpenAI Soraにも使われている「拡散トランスフォーマー・アーキテクチャ」と「フロー・マッチング」という技術を組み合わせる新たな技術が導入されています。

Stability AIは、今回のアップデートで課題となっていた潜在的な害を軽減する機能も果たしていると言及しています。

Stable Diffusion 3は、飛躍的なバージョンアップ!

Stable Diffusion3は、従来のモデルと比較して大幅な品質向上が実現され、多くの新機能が提供されることになります。

ライバルであるDALL-E3との競争にも注目が集まりそうです。

Stability AIは、安全で責任あるAI実践を信じていると述べ、悪意のある者によるStable Diffusion3の利用を防ぐための合理的な措置を講じたとしております。

技術的な進化以外にも、AIが与える社会的な影響への解決にも期待して見ていきたいです。

出典:Stability AI

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUBロゴ

メールマガジン登録

Stable Diffusion・LLM・RAGに関する最新情報をいち早くお届けします。

無料メルマガの配信をご希望の方は、下記フォームよりご登録ください。

    EdgeHUB編集部からのお知らせ

    無料ウェビナーのお知らせ

    【10/30開催 無料ウェビナー】日本語のローカルLLMを使用したRAGの使い方

    RAG×日本語LLMの無料オンラインウェビナー!

    開催日時:
    2024年10月30日(水) 14:00~15:00

    内容:

    • 「LangChain」と「Llama-3-ELYZA-JP」でRAG環境を構築
    • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

    このウェビナーでは、オープンソース「LangChain」で構築したRAGの使い方や、デモを紹介します。

    生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

    こんな方におすすめ!

    • 日本語LLMの利用を検討している方
    • AI開発に携わっている方
    • 最新のAI技術やトレンドに興味がある方
    • GPUスペック不足に悩んでいる方

    \簡単1分で申し込み!/

    この記事を書いた人

    EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

    目次