Stability AI video-to-video生成「Stable Video 4D」発表

2024.07.26

Stability AIが…新たにvideo-to-video生成「Stable Video 4D」を発表した…。

1つの動画から複数の異なるアングルの動画を生成できる画期的なAIモデル…

詳しい情報は…↓↓↓

https://ja.stability.ai/blog/stable-video-4d

Stable Diffusion 3 Mediumが不評?だっただけに…期待大!です。

Hugging Faceで公開されているようですが…

私のPCでは…動かないので…弄れる日を楽しみに…!

Midjourneyにて生成
Midjourneyにて生成

主な特徴は以下の通りです:

  1. 1本の入力動画から8つの新しいアングル/ビューの動画を生成
  2. ユーザーが3Dカメラのポーズを指定可能
  3. 8つの視点にわたる5フレームの動画を約40秒で生成
  4. 全体の4D最適化には約20〜25分かかる

Stability AIは、このモデルが将来的に以下の分野で応用されることを想定しています:

  • ゲーム開発
  • ビデオ編集
  • バーチャルリアリティ
  • 映画制作
  • AR/VR

これらの分野では、複数の視点からオブジェクトを視覚化することで、製品のリアリティと没入感を高めることができるとしています。Stable Video 4Dは、Stability AIの既存モデルである「Stable Video Diffusion」と「Stable Video 3D」をベースに開発されました。このモデルは、幅(x)、高さ(y)、奥行き(z)に加えて時間(t)という4次元の要素を含んでおり、動く3Dオブジェクトを様々なカメラアングルから、異なるタイムスタンプで見ることができるのが特徴です。現在、Stable Video 4DはHugging Faceで公開されており、Stability AIは今後もモデルの改善に取り組んでいく方針です

by Perplexity


Stability AI video-to-video生成「Stable Video 4D」とは?

Stability AIは、2024年7月25日に、1本の動画から8つの異なる視点の動画を生成するAIモデル「Stable Video 4D」を発表しました。

Stable Video 4Dの特徴

  • 1本の動画から8つの異なる視点の動画を生成: ユーザーは1本の動画をアップロードするだけで、8つの異なるアングルの動画を出力することができます。
  • 3Dカメラアングルの指定が可能: ユーザーは任意の3Dカメラアングルを指定することで、生成される動画の視点を変えることができます。
  • 約40秒で生成: 1回の推論で、8視点にわたる 5フレームの動画を約40秒で生成することができます。
  • 将来的にゲーム開発やビデオ編集、バーチャルリアリティ分野での応用が期待される: Stable Video 4Dは、その革新的な技術により、様々な分野での応用が期待されています。

Stable Video 4Dの利用方法

Stable Video 4Dは、Hugging Faceにて公開されています。利用するには、以下の手順が必要です。

  1. Hugging Faceのアカウントを作成する。
  2. Stable Video 4Dのリポジトリにアクセスする。
  3. モデルをダウンロードして、ローカル環境で実行する。

Stable Video 4Dに関する参考情報

by Gemini


New Posts:

Google...「Flow」「Veo 3」「Imagen 4」発表

2025-05-24

高解像度で被写体を中心とした多視点画像生成ができる「ZenCtrl」

2025-05-20

AMD製のハードウェア向けローカル動作型生成AIアート作成ツール「Amuse 3.0」

2025-05-05

3Dモデルを分割できる3D生成AI「HoloPart」

2025-05-02

スケッチから高品質3Dモデル生成「Hunyuan 3D」

2025-05-01

2D三面図を3Dデータ自動変換「3D.Core for CAD」β版

2025-04-30

1枚の静止画と音声データから動画を生成「FantasyTalking」

2025-04-23

「Veo 2」がGemini AdvancedとWhiskでつかえる!

2025-04-20

自然言語でWebアプリケーションを生成「Firebase Studio」

2025-04-19

中国発…オープンソースのアニメ動画生成モデル「AniSora」

2025-04-19

自然言語と音声入力からキャラクターアニメーションを生成「MoCha」

2025-04-16

Amazon「Nova」って?

2025-04-14

PROPMAN DESIGN LLC. 生成AIラボ

2025-04-12

Google...音楽生成AI「Lyria」登場!

2025-04-12

「Tripo」...3D生成AIのスタンダードになるのか!?

2025-04-10

革新的?次世代?動画生成AI「FramePack」

2025-04-10

生成AI活用による広告の現在地

2025-04-08

AdobeでFlux・fal・Veo2・Imagen3・Runwayが使える!

2025-04-07

複数の異なる画像に写る人や物を整合性をとって1枚の画像に統合「UNO」

2025-04-06

テキストや画像から高品質なSVG画像を生成「OmniSVG」

2025-03-22

アニメスタイル画像生成に特化した「NovelAI Diffusion V4 Full」

2025-03-22

静止画からリアルな奥行きと遠近感を持つ高品質な3D動画を生成する「Stable Virtual Camera」

2025-03-22

数枚の画像を組み合わせて自然な動画を生成「SkyReels-A2」

2025-03-22

中国発...世界初の通用型AIエージェント「Manus」

2025-03-22

1枚の画像を参考動画と同じ動きに「DreamActor-M1」

2025-03-22

2D画像から3Dモデルを高速で生成するオープンソースソフトウェア「CUMVS」

2025-03-15

複雑な動きやシーンをリアルに再現...動画生成AI「Wan 2.1」

2025-03-09

映画やテレビで訓練された動画生成AI「SkyReels V1」

2025-03-09

3D空間でオブジェクトやカメラを操作!?動画生成AI「CineMaster」

2025-03-02

Meta「Llama 4」リリース

2025-02-28

AIコンパニオンが…人格を支配する

2025-02-28

SEOからGAIOへ

2025-02-24

広告・マーケティング活用に期待!?動画生成AI「Goku」「Goku+」

2025-02-22

ゲームが創れる!?生成AI「Muse」

2025-02-21

曲に合わせ画像が唄う!?...動画生成AI「OmniHuman-1」

2025-02-16

Adobeバリアブルフォント「百千鳥 VF」をいじってみた!

2025-02-15

スケッチで画像を編集できる!?「FramePainter」

2025-02-06

結局のところ…「Adobe」一択

2025-02-02

AIデザインツール「Kittl」

2025-01-17

「Stable Point Aware 3D」...画像を1秒で3Dモデル化

2025-01-15

あけましておめでとうございます。

2025-01-06

Gemini × Imagen3 = 画像生成AIアプリ「Whisk」

2024-12-18

画像生成AI「Midjourney」アップデート...Profiles and Moodboards

2024-12-17

Google...動画生成AI「Veo 2」リリース

2024-12-17

Midjourney...複数ユーザーがストーリーを共有できる「Patchwork」発表

2024-12-15

動画生成AI「Sora」一般提供開始 → 新規登録を即日停止 → 新規登録再開

2024-12-14

Adobeが写真に写り込む反射を除去できる「Reflection Removal tool」を発表

2024-12-14

Stable Diffusionと連携してブラウザ上で漫画制作できる「Manga Editor Desu!」

2024-12-13

Googleの動画生成モデル「Veo」が使える!?

2024-12-08

Googleの3D空間環境生成AI「Genie 2」

2024-12-08

テキストや画像から高品質な3Dモデルを迅速に生成する「Edify 3D」

2024-12-07

新たな脅威...ビジュアルプロンプトインジェクション攻撃とは...

2024-12-01

Dream Machine サイトリニューアル

2024-12-01

人物画像生成特化型AI「FLUX Portrait Trainer」

2024-12-01

「FLUX1.1 Pro」で使える...「FLUX.1 Tools」登場

2024-11-23

1枚の画像から空間を生成!?「DimensionX」

2024-11-17

AI生成された画像からプロンプトを抽出する...

2024-11-15

最高性能?のアップスケール画像生成AI「DreamClear」

2024-11-12

生成AI検索に移行する中...Google Search Consoleに意味はあるのか?

2024-11-08

プロンプトキャッシングって?

2024-11-05

アプローチが新しい!?マルチモーダル画像生成AI「OmniGen」

2024-11-04

GitHub Copilotってなに?

2024-11-03

Runway Gen-3 Alphaの進化...

2024-11-02

実写動画を3DCGアニメーションに変換「Wonder Animation」

2024-11-01