複雑な動きやシーンをリアルに再現…動画生成AI「Wan 2.1」

2025.03.09

アリババが開発した…オープンソースAIモデル…

画像および動画生成AI「Wan 2.1」…

複雑な動きやシーンをリアルに再現する能力に優れているらしい…

GitHub https://github.com/Wan-Video/Wan2.1

Hugging Face https://huggingface.co/Wan-AI

なんだか…中国ばかりですね…

Fluxにて生成

Wan 2.1の主な特徴

  • オープンソース: Wan 2.1はオープンソースとして公開されており、誰でも利用可能です。これにより、学生や研究者、企業などがこの技術を活用しやすくなっています。
  • 多言語対応: このモデルは、中国語と英語の両方のテキストを理解し、動画生成に活用できるため、国際的なユーザーにとって非常に便利です。
  • 高品質な動画生成: Wan 2.1は、1080Pや720Pの解像度で動画を生成でき、特にマルチオブジェクトインタラクションや複雑な視覚効果において優れたパフォーマンスを発揮します。
  • 多様なモデルバリエーション: アリババは、Wan 2.1の一部として、T2V-1.3B、T2V-14B、I2V-14B-720P、I2V-14B-480Pの4つのモデルをリリースしました。これらのモデルは、異なるパラメーター数を持ち、さまざまな用途に応じた動画生成が可能です。
  • ユーザーフレンドリーなインターフェース: Wan 2.1は、直感的なインターフェースを備えており、技術的なスキルがないユーザーでも簡単にプロフェッショナルな動画を作成できます。

今後の展望

アリババは、AIとクラウドコンピューティングに対して大規模な投資を行っており、Wan 2.1はその一環として位置付けられています。今後、さらなる機能追加や改善が期待されており、特に音声の追加や動画編集の簡素化などが考えられています。

このように、Wan 2.1は、クリエイティブなコンテンツ制作を支援するための強力なツールであり、AI技術の進化を象徴する存在となっています。

by Felo

Fluxにて生成

New Posts: