2024年12月16日、Googleは次世代動画生成AI「Veo 2」を発表しました。この新モデルは、テキストプロンプトなどの指示から数分間の動画を生成でき、最大4Kの高解像度出力に対応しています。
「Veo 2」は、既存の「Veo」から大幅に進化したモデルです。現実世界の物理現象や人間の動き・表情の再現性が向上し、よりリアルで自然な動画を生成できます。さらに、映画制作における多様な表現技法を理解し、複雑なシーンの再現が可能となりました。
たとえば、「シーン中央を滑らかに移動するローアングルのトラッキングショット」や「顕微鏡を覗く科学者の顔をクローズアップするショット」など、具体的なプロンプトに応じて動画を生成します。また、「18mmレンズ」と指定すれば広角レンズ風のショットを作成でき、被写界深度の調整も対応可能です。
Google Labsの「VideoFX」に搭載
今回、「Veo 2」の技術はGoogle Labsが提供する動画生成ツール「VideoFX」に統合され、幅広いユーザーが利用できるようになります。さらに、2025年にはYouTube Shortsや他のGoogle製品にも展開が予定されています。
生成された動画には、Googleの「SynthID」ウォーターマークが含まれ、AIによる生成物であることを識別できるように設計されています。
画像生成AI「Imagen 3」とリミックスツール「Whisk」も発表
Googleは同時に、画像生成AI「Imagen 3」の改良版も発表しました。「Imagen 3」は、構図や明るさに優れた画像を生成する能力が向上し、新たな体験を提供します。このモデルは「ImageFX」を通じて、100カ国以上で利用可能になります。
さらに、Google Labsは画像編集ツール「Whisk」も発表。「Whisk」は、既存の画像にテーマやスタイルを加えることで、シーンや雰囲気を変化させる“リミックス”機能を提供します。このツールは、Imagen 3とGoogleの「Gemini」のビジュアル理解技術を活用しており、16日から米国で提供が開始されています。
未来のクリエイティブツールを提供
「Veo 2」や「Whisk」をはじめとした新しいAIツール群は、動画や画像制作に革新をもたらすことが期待されます。これらの技術により、プロのクリエイターはもちろん、一般ユーザーも簡単に高度な表現ができるようになるでしょう。Googleは、これからのデジタルクリエイションの未来を大きく変える一歩を踏み出しています。