
Googleは現地時間5月20日に開催した年次開発者会議「Google I/O 2025」において、飛躍的な進化を遂げた最新の生成AIモデルを発表した。新たに登場した動画生成モデル「Veo 3」や画像生成モデル「Imagen 4」、そして音楽生成モデル「Lyria 2」により、クリエイターはこれまでにない自由度で創作活動を展開できるようになる。
Veo 3:音声付き動画生成に初対応、物理的リアリティも表現
Veo 3は、これまでの動画生成モデル「Veo 2」の品質を大幅に向上させた上で、音声付き動画の生成に初めて対応。キャラクターの会話、環境音、動きに応じた効果音など、視覚と聴覚の両面でリアルな映像表現が可能となった。
テキストプロンプトから短いストーリーを入力するだけで、登場人物のリップシンクや現実世界の物理法則に則った動きを自然に描き出す。Veo 3は現在、米国においてGoogleの「Gemini」アプリおよび新たに提供が開始された映像制作ツール「Flow」上で、Ultraユーザー向けに利用可能となっている。加えて、エンタープライズ向けには「Vertex AI」上でも提供される。
Veo 2にもアップデート:参照画像・カメラ制御・アウトペインティング
Veo 3の開発過程で得られた知見は、Veo 2にも還元されている。新たに追加された機能としては、以下のようなアップデートが挙げられる。
- 参照画像による動画生成:キャラクターやシーンのスタイルを事前に画像で指定でき、アートディレクションの一貫性が高まる。
- カメラコントロール:カメラの回転やズームなどを精密に制御可能。
- アウトペインティング:画角の拡張や構図の変更に対応し、異なる画面サイズへの適応を容易にする。
- オブジェクトの追加・削除:動画中の物体を自在に編集可能。自然な陰影やスケール感まで自動で調整される。
これらの機能の一部はFlow上で既に利用可能となっており、今後数週間でVertex AI APIを通じて提供範囲が拡大される予定だ。
Flow:プロンプトだけで映像制作が可能に
新たに登場したAI映像制作ツール「Flow」は、Google DeepMindが開発したVeo、Imagen、Geminiなどのモデル群を統合したプラットフォーム。ユーザーは自然言語でシーンやキャラクターを指示するだけで、映画のようなクオリティのクリップを制作できる。
キャスティングやロケーション指定、スタイル調整などの要素を一元管理でき、映像制作のワークフローを劇的に効率化する。Flowは現在、米国において「Google AI Pro」および「Ultra」プランのユーザー向けに提供が開始されており、近日中にさらに多くの国でも提供開始を予定している。
Imagen 4:2K解像度に対応し、フォトリアルから抽象表現まで



画像生成モデル「Imagen 4」は、前バージョンのImagen 3と比較して、速度と品質の両面で大きく進化。布の質感や水滴、動物の毛並みなど、これまで難しかった微細な描写もリアルに表現できる。
最大2K解像度で様々なアスペクト比に対応し、印刷用途からプレゼン資料まで幅広い活用が可能。テキスト生成機能も大幅に強化されており、ポスターやグリーティングカード、漫画などの制作にも適している。
Imagen 4は本日より、Geminiアプリ、Google Workspaceのスライドやドキュメント、そしてVertex AIなどで利用可能となった。今後は処理速度が最大10倍に向上した高速版の提供も予定されている。
Lyria 2:音楽生成の幅を広げるリアルタイム対応モデル
音楽生成モデル「Lyria 2」も正式に一般公開が進んでおり、YouTube Shortsのクリエイター向け、あるいはエンタープライズ向けにVertex AI上で提供が開始された。
Lyria 2は、楽曲構造、テンポ、楽器構成などを細かく制御できるほか、リアルタイム演奏に対応する「Lyria RealTime」も同時に公開。これにより、誰もがインタラクティブに音楽を生成しながら演奏できる新しいスタイルの創作が可能となっている。
関連リンク
(画像:Google)