Gemini × Imagen3 = 画像生成AIアプリ「Whisk」

2024.12.18

Googleが…画像をアップロードすることで新しい画像を生成する…

画像生成AIアプリ「Whisk」を発表…。

裏で…GeminiとImagen3が走ってるみたいですね…。

使いやすさを考えると…こうなっていくのかな?

https://blog.google/technology/google-labs/whisk

↓↓↓アメリカのみで…お試し可能みたいですね…。

https://labs.google/fx/ja/tools/whisk/unsupported-country

ImageFXにて生成

Whiskの主な機能

  • 画像プロンプトの使用: Whiskでは、ユーザーが「Subject(被写体)」、「Scene(シーン)」、「Style(スタイル)」の3つのカテゴリに分けて画像をドラッグ&ドロップすることで、AIがそれらを組み合わせて新しい画像を生成します。これにより、ユーザーは直感的にビジュアルを作成できます。
  • Gemini AIとImagenの活用: WhiskはGoogleのGemini AIとImagen 3を利用しており、アップロードされた画像から詳細なテキストプロンプトを自動生成します。このプロンプトを基に、AIが新しい画像を作成します。
  • 迅速な視覚的探索: Whiskは「迅速な視覚的探索」を目的としており、ユーザーがアイデアを素早く試すことができるよう設計されています。生成された画像は、ユーザーが好みに応じて編集やリミックスが可能です。
  • テキストの補足: ユーザーは必要に応じてテキストを追加することもできますが、必須ではありません。これにより、画像生成のプロセスがさらに柔軟になります。

利用方法

  1. 画像のアップロード: ユーザーは、生成したい画像のテーマに沿った画像を3つ選び、Whiskにアップロードします。
  2. 生成プロセス: Whiskは、アップロードされた画像を基に新しい画像を生成します。このプロセスは数秒で完了します。
  3. 結果の編集: 生成された画像に満足できない場合、ユーザーはプロンプトを編集して再生成することができます。

Whiskは、アートやデザインのプロフェッショナルだけでなく、一般のユーザーにも楽しんでもらえるように設計されており、クリエイティブなアイデアを簡単に視覚化する手段を提供します。

by Felo


New Posts: