静止画からリアルな奥行きと遠近感を持つ高品質な3D動画を生成する「Stable Virtual Camera」

2025.03.22

Stability AIによって開発された新しいマルチビュー拡散モデル…動画生成AI「Stable Virtual Camera

1枚または最大32枚の2D画像から…リアルな奥行きと遠近感を持つ没入型3D動画を生成することができる…

https://stability.ai/news/introducing-stable-virtual-camera-multi-view-video-generation-with-3d-camera-control

Hugging Face | GitHub

各国…各社が…鎬を削っている動画生成AI…

個人的には…若干…勢いが落ちているように感じる?老舗のStability AI…

巻き返しに期待です…。

Fluxにて生成

主な特徴

  • カメラワークの自由度: ユーザーは、ズームインやズームアウト、パン、360度回転など、14種類の動的カメラパスを指定することができます。これにより、生成される動画の視点や動きを直感的にコントロールできます。
  • 動画の長さとフレーム数: 最大1000フレームの動画を生成でき、これは約41秒の長さに相当します。動画はシームレスにループすることが可能で、3Dの一貫性を保ちながら出力されます。
  • 多様なアスペクト比: 正方形(1:1)、縦長(9:16)、横長(16:9)など、さまざまなアスペクト比に対応しており、ユーザーは必要に応じてカスタマイズできます。
  • 簡単な入力: 従来の3D動画生成モデルとは異なり、Stable Virtual Cameraは複雑な前処理や大量の入力画像を必要とせず、指定されたカメラ角度で新しい視点を生成します。
  • 非商用ライセンス: 現在、Stable Virtual Cameraは研究目的で無料で利用可能で、Hugging FaceやGitHubからモデルの重みやコードをダウンロードできます。

この技術は、デジタルフィルム制作や3Dアニメーションにおいて、より高い制御とカスタマイズ性を提供することを目指しています。Stable Virtual Cameraは、生成AIの力を活用し、ユーザーが指定した視点から新しい視覚体験を創出することが可能です。

by Felo

Fluxにて生成