広告・マーケティング活用に期待!?動画生成AI「Goku」「Goku+」

引用

2025.02.22

ByteDanceと香港大学の共同開発により発表された…

動画生成AI「Goku」とその進化版「Goku+

テキストや画像から高品質な動画を生成する能力を持ち…

特に広告やマーケティングの分野での利用が期待されている…。

広告シナリオに特化した機能が追加されている!?との事…。

↑ プロジェクトページ:https://saiyan-world.github.io/goku より抜粋

Fluxにて生成

Goku AIの特徴

  • 高解像度動画生成: Gokuは、テキストや画像を基にした動画生成において、業界最高水準の性能を誇ります。特に、人物の自然な動きや表情をリアルに再現することが可能です。
  • 長尺動画の生成: Gokuは、20秒以上の長尺動画を生成できる能力を持ち、商品プロモーションやカスタマーサービス用の説明動画など、様々なビジネスシーンでの活用が見込まれています。
  • コスト削減: 従来の動画制作コストを100分の1に削減できるとされ、特にデジタルマーケティングやクリエイティブ制作において、効率的なコンテンツ生成が可能です。

Goku+の進化

  • 商業コンテンツ向けの最適化: Goku+は、Gokuを基にさらに強化されたモデルで、特に広告シナリオに特化した機能が追加されています。これにより、人物と商品の相互作用を最適化し、より効果的なマーケティングコンテンツを生成することができます。
  • 直感的なインターフェース: Goku+は、ユーザーがテキストや画像を入力するだけで自動的に動画を生成する直感的なインターフェースを提供し、使いやすさが向上しています。

技術的背景

  • Rectified Flow Transformer: Gokuシリーズは、革新的なRectified Flow Transformerアーキテクチャを採用しており、これにより高解像度かつスムーズなアニメーションを実現しています。
  • 大規模な学習データ: Gokuは、3600万本の動画と1.6億枚の画像を用いた大規模な学習を行っており、これが高品質な動画生成の基盤となっています。

GokuとGoku+は、AIによる動画生成の新たな可能性を切り開く技術として、今後のデジタルコンテンツ制作において重要な役割を果たすことが期待されています。

by Felo

Fluxにて生成

ゲームが創れる!?生成AI「Muse」

引用

2025.02.21

Microsoftが…ゲーム生成AI「Muse」を発表した…。

AIが創った!?ゲームに…一喜一憂する時代かぁ…

私は…一切ゲームはしませんが…(未だ…興味が湧かないんです…)

Midjourneyにて生成
Microsoft Webサイトより

Microsoftは2025年2月19日に、ゲーム開発者とプレイヤーを支援する新たな生成AIモデル「Muse」を発表しました。このAIは、特にゲームプレイのアイデア出しやプロトタイピングを目的として設計されています。

Museの概要

技術的背景
Museは、Microsoft ResearchとXbox Game StudiosのNinja Theoryが共同で開発した「World and Human Action Model」(WHAM)に基づいています。このモデルは、10億以上のゲームプレイデータを学習しており、特にNinja Theoryのオンライン対戦ゲーム「Bleeding Edge」のデータを活用しています。このデータは、約50万件の匿名化されたゲームセッションから抽出され、7年分のプレイデータに相当します。

機能と目的
Museは、ゲーム内の物理法則やプレイヤーのコントローラー操作に基づいて、リアルタイムでゲームプレイを生成する能力を持っています。具体的には、プレイヤーが入力したコントローラーの操作に応じて、ゲーム内のキャラクターの動きや環境を生成することが可能です。これにより、開発者は新しいゲーム体験を迅速にプロトタイプ化したり、既存のゲームに新しいコンテンツを追加したりすることが期待されています。

今後の展望

Microsoftは、Museを通じて古いゲームを現代のデバイスでプレイ可能にすることや、プレイヤーがコンテンツ制作に参加できる機会を提供することを目指しています。また、Museの技術を利用することで、ゲームの保存や体験方法が根本的に変わる可能性があるとしています。

この新しいAIモデルは、ゲーム開発の未来において重要な役割を果たすことが期待されており、今後の発展に注目が集まっています。Microsoftは、2025年3月18日に開催されるゲーム開発者会議「GDC 2025」でさらに詳細な発表を行う予定です。

by Felo

Midjourneyにて生成

曲に合わせ画像が唄う!?…動画生成AI「OmniHuman-1」

引用

2025.02.16

ByteDanceが開発した…「OmniHuman-1

https://omnihuman-lab.github.io

画像やキャラクターを…唄わせたり…喋らせたり…できるらしい…。

https://omnihuman-lab.github.io
https://omnihuman-lab.github.io

Omni=全ての・全能の Human=人・人類 とは….

フェイクが…溢れる世の中かぁ…

ちなみに…「OmniHuman」でFluxで画像生成してみたら…

Fluxにて生成

OmniHuman-1の概要

OmniHuman-1は、ByteDanceが開発した先進的なAIフレームワークで、単一の画像から非常にリアルな人間の動画を生成することができます。この技術は、音声や他の動画信号を組み合わせることで、自然な動きや表情を持つ動画をリアルタイムで生成することが可能です。

主な機能と特徴

  • マルチモーダル入力: OmniHuman-1は、画像と音声などの異なる入力を組み合わせて、リアルな動画を生成します。これにより、ユーザーは単一の画像を提供するだけで、動きや口の動きが同期した動画を得ることができます。
  • 高品質な出力: このモデルは、非常に高い解像度と少ないグリッチで動画を生成する能力を持ち、特に音声に基づく生成において優れたパフォーマンスを発揮します。
  • リアルな表現: OmniHuman-1は、18,700時間以上の人間の動画データで訓練されており、非常にリアルな動きや表情を再現することができます。これにより、政治的なディープフェイクや偽情報の生成に対する懸念も高まっています。

技術的進化と影響

OmniHuman-1は、従来のモデルが数百または数千の画像を必要とするのに対し、たった一枚の画像からリアルな動画を生成できる点で革新的です。この技術の進展は、コンテンツ制作のハードルを大幅に下げる可能性があり、特にTikTokのクリエイターが自身のバーチャルアバターを生成して使用することで、より多様なコンテンツを生み出すことが期待されています。

倫理的懸念

この技術の進展には、ディープフェイク技術の悪用に関する懸念も伴います。専門家は、政治的な偽情報やアイデンティティの盗用など、悪用のリスクが高まると警告しています。ByteDanceは、技術が一般公開される際には、悪影響を防ぐための厳格な安全策を講じるとしています。

OmniHuman-1は、AIによる動画生成の新たな可能性を切り開く一方で、その利用に関する倫理的な議論も引き起こしています。

by Felo

Fluxにて生成

スケッチで画像を編集できる!?「FramePainter」

引用

2025.02.06

スケッチ感覚で直感的に画像を編集できる画像編集AIツール「FramePainter

GitHubを見ると…

https://github.com/YBYBZhang/FramePainter

https://github.com/YBYBZhang/FramePainter より
https://github.com/YBYBZhang/FramePainter より

こりゃぁ…便利である!!!

Photoshopに搭載されないかしら!?

Paper https://arxiv.org/abs/2501.08225

Fluxにて生成

FramePainterの概要

FramePainterは、最新のAI技術を活用した画像編集ツールで、特にスケッチベースの操作を通じてユーザーが直感的に画像を編集できることを目的としています。このツールは、ビデオ拡散技術を利用しており、ユーザーの意図を理解し、プロフェッショナルな編集結果を提供します。

主な機能

  • 直感的なスケッチコントロール: ユーザーは画像上に直接スケッチを描くことで、編集したい内容を表現できます。FramePainterはこのスケッチを解析し、具体的な編集を実行します。
  • リアルタイムプレビュー: 編集の結果をリアルタイムで確認できる機能があり、ユーザーは変更を即座に視覚化できます。
  • 多様な応用シナリオ: FramePainterは、クリエイティブデザイン、広告画像編集、ソーシャルメディアコンテンツ制作、映画のポストプロダクション、ゲームアートデザインなど、さまざまな分野で利用可能です。

技術的な特徴

FramePainterは、ビデオ拡散モデルを基にした強力なAI技術を採用しており、これにより従来の編集ツールに比べて高い編集能力を実現しています。特に、ユーザーが描いたスケッチを基にした編集が可能で、複雑な変換も簡単に行えます。

オープンソースプロジェクト

FramePainterは現在オープンソースプロジェクトとして開発されており、GitHubで最新の更新やリリース情報を確認することができます。ユーザーは、ツールをインストールして自分の画像編集プロジェクトに活用することができます。

結論

FramePainterは、AIを活用した革新的な画像編集ツールであり、ユーザーが直感的に操作できるスケッチベースのインターフェースを提供します。これにより、従来の編集ツールでは難しかった複雑な編集も簡単に行えるようになっています。

by Felo

Fluxにて生成