Googleの3D空間環境生成AI「Genie 2」

2024.12.08

1枚の画像から…最大1分の3D空間環境を生成でき…

キャラクターを自在に動かすことができる…「Genie 2」がリリースされた…。

↓を見ると…「ここまできたかぁ…」って感じです…。

残念ながら…現時点では一般公開の予定はないみたいですね…。

いじってみたい…。

https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model

Flux Pro 1.1にて生成

「Genie 2」概要

Google DeepMindが発表した「Genie 2」は、単一の画像からインタラクティブな3D環境を生成する新しいAIモデルです。この技術は、ゲーム開発やAI研究において革新的な可能性を秘めています。Genie 2は、ユーザーがアップロードした画像やテキストから、最大1分間持続するプレイ可能な3Dワールドを作成します。

主な機能

  • インタラクティブな3D環境の生成: Genie 2は、物理シミュレーションや環境効果を取り入れたリアルな3D空間を生成します。ユーザーは、非プレイヤーキャラクター(NPC)や物体と相互作用しながら、環境を探索できます。
  • 多様な視点のサポート: 生成された環境は、一人称視点、三人称視点、アイソメトリックビューなど、さまざまな視点から体験可能です。
  • 持続的な環境: Genie 2が生成する3Dワールドは、ユーザーの行動に応じて変化し、次回のセッションでもその状態を保持します。これにより、ストーリーやゲームプレイの連続性が確保されます。
  • 高度な物理シミュレーション: 環境内では、重力や流体力学、衝突効果などがリアルにシミュレートされ、プレイヤーは物体を操作したり、NPCとインタラクションを行ったりできます。

技術的背景

Genie 2は、自己回帰型潜在拡散モデルに基づいており、大規模な動画データセットで訓練されています。このモデルは、入力された画像をもとにリアルタイムで3D環境を構築する能力を持っています。

応用可能性

この技術は、ゲーム開発の迅速なプロトタイピングを可能にし、開発者が静的なコンセプトアートやアイデアをすぐにプレイ可能なプロトタイプに変換することを助けます。また、AIのトレーニングやロボット工学の分野でも重要な役割を果たすと期待されています。

結論

GoogleのGenie 2は、単一の画像からインタラクティブな3Dワールドを生成する能力を持つ先進的なAIモデルであり、ゲーム開発やAI研究において新たな可能性を切り開く技術です。今後の進展が非常に楽しみです。

by Felo

Flux Pro 1.1にて生成

New Posts:
あけましておめでとうございます。2025-01-06
Gemini × Imagen3 = 画像生成AIアプリ「Whisk」2024-12-18
画像生成AI「Midjourney」アップデート...Profiles and Moodboards2024-12-17
Google...動画生成AI「Veo 2」リリース2024-12-17
Midjourney...複数ユーザーがストーリーを共有できる「Patchwork」発表2024-12-15
動画生成AI「Sora」一般提供開始 → 新規登録を即日停止 → 新規登録再開2024-12-14
Adobeが写真に写り込む反射を除去できる「Reflection Removal tool」を発表2024-12-14
Stable Diffusionと連携してブラウザ上で漫画制作できる「Manga Editor Desu!」2024-12-13
Googleの動画生成モデル「Veo」が使える!?2024-12-08
テキストや画像から高品質な3Dモデルを迅速に生成する「Edify 3D」2024-12-07
新たな脅威...ビジュアルプロンプトインジェクション攻撃とは...2024-12-01
Dream Machine サイトリニューアル2024-12-01
人物画像生成特化型AI「FLUX Portrait Trainer」2024-12-01
「FLUX1.1 Pro」で使える...「FLUX.1 Tools」登場2024-11-23
1枚の画像から空間を生成!?「DimensionX」2024-11-17
AI生成された画像からプロンプトを抽出する...2024-11-15
最高性能?のアップスケール画像生成AI「DreamClear」2024-11-12
生成AI検索に移行する中...Google Search Consoleに意味はあるのか?2024-11-08
プロンプトキャッシングって?2024-11-05
アプローチが新しい!?マルチモーダル画像生成AI「OmniGen」2024-11-04
GitHub Copilotってなに?2024-11-03
Runway Gen-3 Alphaの進化...2024-11-02
実写動画を3DCGアニメーションに変換「Wonder Animation」2024-11-01
Adobe Firefly Generate Video...まもなく...2024-10-28
プログラミング知識不要でAIアプリケーション開発できる「Dify」2024-10-28
コンピューターを操作することができる生成AI「Claude 3.5 Sonnet」2024-10-27
Midjourney...新外部画像エディターについて2024-10-24
Haiper 2.0...登場!2024-10-23
3種のStable Diffusion 3.5 リリース2024-10-23
高品質な短編動画を効率的に生成する動画生成AI「Pyramid Flow」2024-10-22
文書、テキスト、画像などを構造化データに変換するOmniAIのOCRデモ2024-10-21
イチゴが苦手な!?大規模言語モデル(LLM)2024-10-20
電子インボイス国際的標準規格「Peppol」2024-10-19
MidjourneyのWeb画像エディターが新しくなる?2024-10-19
画像から音楽を生成するSuno AI「Scene」2024-10-19
4096×4096ピクセルの高解像度画像を数秒以内に生成できる「Sana」2024-10-18
Adobeの2024年10月14日リリースから「Adobe Firefly Video Model」「Project Neo」2024-10-17
Geminiで画像生成AI「Imagen 3」が使えるように!2024-10-14
Adobe...デジタル署名?発表2024-10-13
生成AI×スマートグラス=個人情報丸見え!?2024-10-12
画像から高解像度3D深度マップを高速生成「Depth Pro」2024-10-08
開発者向けの生成AIプラットフォーム「fal.ai」2024-10-07
人間やキャラクターを動画に合成できるビデオ合成AI「MIMO」2024-10-06
Meta 新しいAI動画生成モデル「Movie Gen」発表2024-10-05
TikTokのByteDance 動画生成AI「Doubao」シリーズ発表2024-10-03
動画生成AI「Pika 1.5 」リリース!2024-10-03
生成AI検索に対応した要約しやすいWebサイトとは?2024-10-02
日本語性能世界一LLM「Takane」提供開始2024-10-01
Gmailに返信メール生成AI搭載...2024-09-30
代わりに電話をかけてくれるAIサービス2024-09-29
多様な画像生成タスクを統合「OmniGen」2024-09-28
人に説明するのも...生成AIに指示を出すのも...2024-09-28
もはや...作業や処理は生成AIに任せ方が...2024-09-27
日本人には縁遠い?「Llama」がアップデート2024-09-26
より人間らしく…「Advanced Voice Mode」公開2024-09-25
AIで「縁結び」スタート...東京都2024-09-24
「生成AIガチャ」と言われる段階で...2024-09-23
詐欺メールの削除から始まる日常2024-09-23
フリーランス保護新法 施行で...単価が上がる?2024-09-22
「MemoRAG」が生成AIを進化させる2024-09-21
図解生成AI「Napkin」が日本語に対応2024-09-20
1080p HDに対応したKLING 1.52024-09-19
YouTubeがVeoを統合...6秒の動画生成が可能に2024-09-19
Adobe Premiereが最強になる日?2024-09-18