2024.12.08
1枚の画像から…最大1分の3D空間環境を生成でき…
キャラクターを自在に動かすことができる…「Genie 2」がリリースされた…。
↓を見ると…「ここまできたかぁ…」って感じです…。
残念ながら…現時点では一般公開の予定はないみたいですね…。
いじってみたい…。
https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model

「Genie 2」概要
Google DeepMindが発表した「Genie 2」は、単一の画像からインタラクティブな3D環境を生成する新しいAIモデルです。この技術は、ゲーム開発やAI研究において革新的な可能性を秘めています。Genie 2は、ユーザーがアップロードした画像やテキストから、最大1分間持続するプレイ可能な3Dワールドを作成します。
主な機能
- インタラクティブな3D環境の生成: Genie 2は、物理シミュレーションや環境効果を取り入れたリアルな3D空間を生成します。ユーザーは、非プレイヤーキャラクター(NPC)や物体と相互作用しながら、環境を探索できます。
- 多様な視点のサポート: 生成された環境は、一人称視点、三人称視点、アイソメトリックビューなど、さまざまな視点から体験可能です。
- 持続的な環境: Genie 2が生成する3Dワールドは、ユーザーの行動に応じて変化し、次回のセッションでもその状態を保持します。これにより、ストーリーやゲームプレイの連続性が確保されます。
- 高度な物理シミュレーション: 環境内では、重力や流体力学、衝突効果などがリアルにシミュレートされ、プレイヤーは物体を操作したり、NPCとインタラクションを行ったりできます。
技術的背景
Genie 2は、自己回帰型潜在拡散モデルに基づいており、大規模な動画データセットで訓練されています。このモデルは、入力された画像をもとにリアルタイムで3D環境を構築する能力を持っています。
応用可能性
この技術は、ゲーム開発の迅速なプロトタイピングを可能にし、開発者が静的なコンセプトアートやアイデアをすぐにプレイ可能なプロトタイプに変換することを助けます。また、AIのトレーニングやロボット工学の分野でも重要な役割を果たすと期待されています。
結論
GoogleのGenie 2は、単一の画像からインタラクティブな3Dワールドを生成する能力を持つ先進的なAIモデルであり、ゲーム開発やAI研究において新たな可能性を切り開く技術です。今後の進展が非常に楽しみです。
by Felo

New Posts: