Stability AI video-to-video生成「Stable Video 4D」発表

2024.07.26

Stability AIが…新たにvideo-to-video生成「Stable Video 4D」を発表した…。

1つの動画から複数の異なるアングルの動画を生成できる画期的なAIモデル…

詳しい情報は…↓↓↓

https://ja.stability.ai/blog/stable-video-4d

Stable Diffusion 3 Mediumが不評?だっただけに…期待大!です。

Hugging Faceで公開されているようですが…

私のPCでは…動かないので…弄れる日を楽しみに…!

Midjourneyにて生成
Midjourneyにて生成

主な特徴は以下の通りです:

  1. 1本の入力動画から8つの新しいアングル/ビューの動画を生成
  2. ユーザーが3Dカメラのポーズを指定可能
  3. 8つの視点にわたる5フレームの動画を約40秒で生成
  4. 全体の4D最適化には約20〜25分かかる

Stability AIは、このモデルが将来的に以下の分野で応用されることを想定しています:

  • ゲーム開発
  • ビデオ編集
  • バーチャルリアリティ
  • 映画制作
  • AR/VR

これらの分野では、複数の視点からオブジェクトを視覚化することで、製品のリアリティと没入感を高めることができるとしています。Stable Video 4Dは、Stability AIの既存モデルである「Stable Video Diffusion」と「Stable Video 3D」をベースに開発されました。このモデルは、幅(x)、高さ(y)、奥行き(z)に加えて時間(t)という4次元の要素を含んでおり、動く3Dオブジェクトを様々なカメラアングルから、異なるタイムスタンプで見ることができるのが特徴です。現在、Stable Video 4DはHugging Faceで公開されており、Stability AIは今後もモデルの改善に取り組んでいく方針です

by Perplexity


Stability AI video-to-video生成「Stable Video 4D」とは?

Stability AIは、2024年7月25日に、1本の動画から8つの異なる視点の動画を生成するAIモデル「Stable Video 4D」を発表しました。

Stable Video 4Dの特徴

  • 1本の動画から8つの異なる視点の動画を生成: ユーザーは1本の動画をアップロードするだけで、8つの異なるアングルの動画を出力することができます。
  • 3Dカメラアングルの指定が可能: ユーザーは任意の3Dカメラアングルを指定することで、生成される動画の視点を変えることができます。
  • 約40秒で生成: 1回の推論で、8視点にわたる 5フレームの動画を約40秒で生成することができます。
  • 将来的にゲーム開発やビデオ編集、バーチャルリアリティ分野での応用が期待される: Stable Video 4Dは、その革新的な技術により、様々な分野での応用が期待されています。

Stable Video 4Dの利用方法

Stable Video 4Dは、Hugging Faceにて公開されています。利用するには、以下の手順が必要です。

  1. Hugging Faceのアカウントを作成する。
  2. Stable Video 4Dのリポジトリにアクセスする。
  3. モデルをダウンロードして、ローカル環境で実行する。

Stable Video 4Dに関する参考情報

by Gemini


New Posts:
あけましておめでとうございます。2025-01-06
Gemini × Imagen3 = 画像生成AIアプリ「Whisk」2024-12-18
画像生成AI「Midjourney」アップデート...Profiles and Moodboards2024-12-17
Google...動画生成AI「Veo 2」リリース2024-12-17
Midjourney...複数ユーザーがストーリーを共有できる「Patchwork」発表2024-12-15
動画生成AI「Sora」一般提供開始 → 新規登録を即日停止 → 新規登録再開2024-12-14
Adobeが写真に写り込む反射を除去できる「Reflection Removal tool」を発表2024-12-14
Stable Diffusionと連携してブラウザ上で漫画制作できる「Manga Editor Desu!」2024-12-13
Googleの動画生成モデル「Veo」が使える!?2024-12-08
Googleの3D空間環境生成AI「Genie 2」2024-12-08
テキストや画像から高品質な3Dモデルを迅速に生成する「Edify 3D」2024-12-07
新たな脅威...ビジュアルプロンプトインジェクション攻撃とは...2024-12-01
Dream Machine サイトリニューアル2024-12-01
人物画像生成特化型AI「FLUX Portrait Trainer」2024-12-01
「FLUX1.1 Pro」で使える...「FLUX.1 Tools」登場2024-11-23
1枚の画像から空間を生成!?「DimensionX」2024-11-17
AI生成された画像からプロンプトを抽出する...2024-11-15
最高性能?のアップスケール画像生成AI「DreamClear」2024-11-12
生成AI検索に移行する中...Google Search Consoleに意味はあるのか?2024-11-08
プロンプトキャッシングって?2024-11-05
アプローチが新しい!?マルチモーダル画像生成AI「OmniGen」2024-11-04
GitHub Copilotってなに?2024-11-03
Runway Gen-3 Alphaの進化...2024-11-02
実写動画を3DCGアニメーションに変換「Wonder Animation」2024-11-01
Adobe Firefly Generate Video...まもなく...2024-10-28
プログラミング知識不要でAIアプリケーション開発できる「Dify」2024-10-28
コンピューターを操作することができる生成AI「Claude 3.5 Sonnet」2024-10-27
Midjourney...新外部画像エディターについて2024-10-24
Haiper 2.0...登場!2024-10-23
3種のStable Diffusion 3.5 リリース2024-10-23
高品質な短編動画を効率的に生成する動画生成AI「Pyramid Flow」2024-10-22
文書、テキスト、画像などを構造化データに変換するOmniAIのOCRデモ2024-10-21
イチゴが苦手な!?大規模言語モデル(LLM)2024-10-20
電子インボイス国際的標準規格「Peppol」2024-10-19
MidjourneyのWeb画像エディターが新しくなる?2024-10-19
画像から音楽を生成するSuno AI「Scene」2024-10-19
4096×4096ピクセルの高解像度画像を数秒以内に生成できる「Sana」2024-10-18
Adobeの2024年10月14日リリースから「Adobe Firefly Video Model」「Project Neo」2024-10-17
Geminiで画像生成AI「Imagen 3」が使えるように!2024-10-14
Adobe...デジタル署名?発表2024-10-13
生成AI×スマートグラス=個人情報丸見え!?2024-10-12
画像から高解像度3D深度マップを高速生成「Depth Pro」2024-10-08
開発者向けの生成AIプラットフォーム「fal.ai」2024-10-07
人間やキャラクターを動画に合成できるビデオ合成AI「MIMO」2024-10-06
Meta 新しいAI動画生成モデル「Movie Gen」発表2024-10-05
TikTokのByteDance 動画生成AI「Doubao」シリーズ発表2024-10-03
動画生成AI「Pika 1.5 」リリース!2024-10-03
生成AI検索に対応した要約しやすいWebサイトとは?2024-10-02
日本語性能世界一LLM「Takane」提供開始2024-10-01
Gmailに返信メール生成AI搭載...2024-09-30
代わりに電話をかけてくれるAIサービス2024-09-29
多様な画像生成タスクを統合「OmniGen」2024-09-28
人に説明するのも...生成AIに指示を出すのも...2024-09-28
もはや...作業や処理は生成AIに任せ方が...2024-09-27
日本人には縁遠い?「Llama」がアップデート2024-09-26
より人間らしく…「Advanced Voice Mode」公開2024-09-25
AIで「縁結び」スタート...東京都2024-09-24
「生成AIガチャ」と言われる段階で...2024-09-23
詐欺メールの削除から始まる日常2024-09-23
フリーランス保護新法 施行で...単価が上がる?2024-09-22
「MemoRAG」が生成AIを進化させる2024-09-21
図解生成AI「Napkin」が日本語に対応2024-09-20
1080p HDに対応したKLING 1.52024-09-19
YouTubeがVeoを統合...6秒の動画生成が可能に2024-09-19