「Veo(ベオ)」とは?Googleの最先端動画生成AIの特徴と公開はいつから?

2024年5月14日、Googleは開発者向けイベント「Google I/O 2024」で動画生成AI「Veo(ベオ)」を発表しました。

Veoは、そのクオリティの高さから世界中で大きな注目を集めています。

この記事では、テキストから動画を生成するAI「Veo」の特徴や活用方法について詳しく解説します。

目次

動画生成AI「Veo」とは?

(出典:deepmind.google)

Veo(ベオ)は、テキストから1分超の動画を生成できるサービスです。

発表されたデモ映像は、映画のような高い質感があります。

Veoは自然言語の理解力が高く、時間の経過を早送りで見せるタイムラプスや風景のドローン空撮などにも対応した最先端の動画を作成することができます。

現在までに分かっている「Veo」の特徴をまとめました。

  • マスク編集機能を使って部分的に編集することができる
  • 画像を入力して動画を作成できる
  • AIが作ったコンテンツであることを判別できるSynthIDが埋め込まれる

これらの特徴について詳しく紹介していきます。

マスク編集機能を使って部分的に編集することができる

veo
(出典:deepmind.google)

マスク編集機能とは、特定の部分だけを再生成して編集する機能です。

デモ動画では、海辺にカヤックを追加して生成した様子が公開されています。

従来、生成された動画を修正するには再度プロンプトを変更して生成を繰り返していくことで精度を上げる必要がありましたが、Veoはこれを回避できます。

これにより、生成にかかる時間やパワーコストが削減できます

画像を入力して動画を作成できる

veo
(出典:deepmind.google)

Veoは、画像とテキストを組み合わせて動画を生成することができます。

これにより、テキストで表現するのが難しい内容も簡単に入力することが可能になります。

Googleの開発者向けイベント「Google I/O 2024」で同時に発表された、新しい画像生成AI「Imagen 3」と併せて利用することで、クリエイティブの幅が大きく広がることになるでしょう。

AIが作ったコンテンツであることを判別できるSynthIDが埋め込まれる

Veoで作った動画には電子透かし「SynthID」が埋め込まれます。

「SynthID」は動画内に埋め込まれますが、人間の視覚では確認できません。

生成AIで作られた画像や動画が、フェイクとして出回るといった社会問題が発生していることに対策した仕組みです。

誰でも自由に制作や公開ができる仕組みが整っていて安心です。

動画生成AI「Veo」の一般公開はいつから?

(出典:deepmind.google)

2024年5月16日現在、Veoは一般公開されていません。

今後、選ばれたクリエイターが早期アクセスできるようになり、フィードバックを受ける予定です。

Googleは将来的に 「Veo」 の機能の一部をYouTube Shortやその他のサービスに導入することを決定しています。

現在、VeoはVideoFXにてウェイトリストを公開しているので登録して待ちましょう!

\ウェイトリスト登録はこちら/

動画生成AI「Veo」の仕組み

veoの仕組み
(出典:deepmind.google)

Veoは、Generative Query Network(GQN)DVD-GANImagen-VideoPhenakiWALTVideoPoetLumiereなどの仕組みに基づいて構成されています。

※用語と仕組みに関してはリンク先のドキュメントを参照してください。

さらにパフォーマンスを向上させるために、Veoは潜在拡散トランスフォーマー(Latent Diffusion Transformers)を用いて、フレーム間の一貫性を維持し、視覚的連続性を高めています。

これらの技術により、全体的な品質が向上し、ビデオの生成にかかる時間が短縮されます。

(出典:Google DeepMind)

動画生成AI「Veo」の使い方

(出典:deepmind.google)

こちらのデモ映像は映画監督ドナルド・グローバーとクリエイティブスタジオ・ギルガとの作品のプレビューです。

Googleは、今後数週間以内に「VideoFX」を通じて、Veoの一部の機能をクローズドで提供すると発表しています。

Veoの機能は、YouTube Shortsなどにも組み込む予定であるとしています。

一部のユーザーだけではなく、より多くのユーザーが気軽に使えると期待されています。

動画生成AI「Veo」の一般公開を楽しみに待とう!

Googleの動画生成AI「Veo」は、テキストから高品質な動画を生成できるサービスです。

2024年5月16日現在はまだ一般公開されていませんが、VideoFXにてウェイトリストを公開しているので登録して待ちましょう!

\ウェイトリスト登録はこちら/

GPUSOROBAN
https://soroban.highreso.jp/

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
EdgeHUB編集部からのお知らせ

無料ウェビナーのお知らせ

8/28ウェビナー

サイバーエージェントの日本語LLM& 日本語VLMの 無料オンラインウェビナー!

開催日時:
2024年8月28日(水) 14:00~15:00

内容:

  • 「CyberAgentLM3」や「llava-calm2-siglip」の概要と使い方の紹介
  • 生成AI開発の強い味方「GPUSOROBAN」の活用方法

このウェビナーでは、サイバーエージェントの日本語の強いの大規模言語モデル「CyberAgentLM3」の使い方や、実際にどのように使えるかを具体的に紹介します。

また、画像からテキストを簡単に抽出する日本語VLM「llava-calm2-siglip」の使い方を紹介。手間いらずで効率アップ間違いなし!

生成AIに関心のある方、AI技術をビジネスに活かしたい方は、ぜひこの貴重な機会にご参加ください!

こんな方におすすめ!

  • 日本語LLMの利用を検討している方
  • AI開発に携わっている方
  • 最新のAI技術やトレンドに興味がある方
  • GPUスペック不足に悩んでいる方

\簡単1分で申し込み!/

この記事を書いた人

EdgeHUBは、NVIDIAクラウドパートナーである株式会社ハイレゾが運営しています。「AIと共にある未来へ繋ぐ」をテーマに、画像生成AI、文章生成AI、動画生成AI、機械学習・LLM、Stable Diffusionなど、最先端の生成AI技術の使い方をわかりやすく紹介します。

目次