Google、画像生成モデル｢Imagen 3｣発表。ディティールとプロンプトの理解力が向上

現地時間5月14日、米Googleは年次開発者会議｢Google I/O 2024｣を開催。同イベントの基調講演のなかで、画像生成モデル｢Imagen 3｣を発表した。

｢Imagen 3｣は、Googleの画像生成モデル｢Imagen 2｣をアップデートした最新版。従来モデルに比べて優れたディティールを実現し、フォトリアリスティックな風景や豊かな質感の油絵など、幅広いフォーマットとスタイルで高品質な画像を生成できるようになった。

また、自然言語やプロンプトの背後にある意図を理解する能力が大幅に改善し、長いプロンプトからも細かな詳細を画像に取り入れることができるという。

さらに、画像生成モデルにおいて課題とされているテキストレンダリング機能も大幅に改善。パーソナライズされたバースデーカードの作成やプレゼンテーションのスライドの生成にも役立つとしている。

｢Imagen 3｣は、Google Labsの｢VideoFX｣ツールを通じて利用可能。本日からウェイティングリストが公開されている。

(画像：Google)