2024年5月14日、Googleは開発者向けイベント「Google I/O 2024」で動画生成AI「Veo(ベオ)」を発表しました。
Veoは、そのクオリティの高さから世界中で大きな注目を集めています。
この記事では、テキストから動画を生成するAI「Veo」の特徴や活用方法について詳しく解説します。
動画生成AI「Veo」とは?
Veo(ベオ)は、テキストから1分超の動画を生成できるサービスです。
発表されたデモ映像は、映画のような高い質感があります。
Veoは自然言語の理解力が高く、時間の経過を早送りで見せるタイムラプスや風景のドローン空撮などにも対応した最先端の動画を作成することができます。
現在までに分かっている「Veo」の特徴をまとめました。
- マスク編集機能を使って部分的に編集することができる
- 画像を入力して動画を作成できる
- AIが作ったコンテンツであることを判別できるSynthIDが埋め込まれる
これらの特徴について詳しく紹介していきます。
マスク編集機能を使って部分的に編集することができる
マスク編集機能とは、特定の部分だけを再生成して編集する機能です。
デモ動画では、海辺にカヤックを追加して生成した様子が公開されています。
従来、生成された動画を修正するには再度プロンプトを変更して生成を繰り返していくことで精度を上げる必要がありましたが、Veoはこれを回避できます。
これにより、生成にかかる時間やパワーコストが削減できます。
画像を入力して動画を作成できる
Veoは、画像とテキストを組み合わせて動画を生成することができます。
これにより、テキストで表現するのが難しい内容も簡単に入力することが可能になります。
Googleの開発者向けイベント「Google I/O 2024」で同時に発表された、新しい画像生成AI「Imagen 3」と併せて利用することで、クリエイティブの幅が大きく広がることになるでしょう。
AIが作ったコンテンツであることを判別できるSynthIDが埋め込まれる
Veoで作った動画には電子透かし「SynthID」が埋め込まれます。
「SynthID」は動画内に埋め込まれますが、人間の視覚では確認できません。
生成AIで作られた画像や動画が、フェイクとして出回るといった社会問題が発生していることに対策した仕組みです。
誰でも自由に制作や公開ができる仕組みが整っていて安心です。
動画生成AI「Veo」の一般公開はいつから?
2024年5月16日現在、Veoは一般公開されていません。
今後、選ばれたクリエイターが早期アクセスできるようになり、フィードバックを受ける予定です。
Googleは将来的に 「Veo」 の機能の一部をYouTube Shortやその他のサービスに導入することを決定しています。
現在、VeoはVideoFXにてウェイトリストを公開しているので登録して待ちましょう!
\ウェイトリスト登録はこちら/
動画生成AI「Veo」の仕組み
Veoは、Generative Query Network(GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet、Lumiereなどの仕組みに基づいて構成されています。
※用語と仕組みに関してはリンク先のドキュメントを参照してください。
さらにパフォーマンスを向上させるために、Veoは潜在拡散トランスフォーマー(Latent Diffusion Transformers)を用いて、フレーム間の一貫性を維持し、視覚的連続性を高めています。
これらの技術により、全体的な品質が向上し、ビデオの生成にかかる時間が短縮されます。
(出典:Google DeepMind)
動画生成AI「Veo」の使い方
こちらのデモ映像は映画監督ドナルド・グローバーとクリエイティブスタジオ・ギルガとの作品のプレビューです。
Googleは、今後数週間以内に「VideoFX」を通じて、Veoの一部の機能をクローズドで提供すると発表しています。
Veoの機能は、YouTube Shortsなどにも組み込む予定であるとしています。
一部のユーザーだけではなく、より多くのユーザーが気軽に使えると期待されています。
動画生成AI「Veo」の一般公開を楽しみに待とう!
Googleの動画生成AI「Veo」は、テキストから高品質な動画を生成できるサービスです。
2024年5月16日現在はまだ一般公開されていませんが、VideoFXにてウェイトリストを公開しているので登録して待ちましょう!
\ウェイトリスト登録はこちら/