Meta 新しいAI動画生成モデル「Movie Gen」発表

引用

2024.10.05

2024年10月4日…Metaが…

新しいAI動画生成モデル「Movie Gen」を発表した…。

来年公開?みたいですね…。

Midjourneyにて生成
Flux 1.1にて生成

このモデルは、テキストから高解像度の動画と音声を生成することができ、最長16秒の動画を1080pの解像度で作成可能です。音声は最大45秒まで生成でき、環境音や効果音、BGMも自動的に生成し、映像と同期させることができます。

Movie Genの主な機能には、既存の動画や静止画を編集する能力も含まれています。ユーザーは動画内の要素を追加したり、背景を変更したりすることができ、これによりクリエイティブな表現が大幅に向上します。例えば、MetaのCEOマーク・ザッカーバーグは、自身のトレーニング動画を異なる背景や衣装に変換するデモを行いました。

この技術は、特にエンターテインメント業界において大きな影響を与える可能性があります。映画制作やコンテンツ制作のプロセスを効率化し、クリエイターがより多くの時間を創造的な作業に費やすことができるようになるでしょう。しかし、一方で著作権や悪用の懸念も指摘されています。特にディープフェイク技術の進化により、偽情報の拡散やプライバシー侵害といった問題が懸念されています。

現時点ではMovie Genは研究段階にあり、商業利用にはまだ時間がかかるとされています。Metaは将来的にこの技術をInstagramなど自社プラットフォームに統合する意向を示していますが、具体的なリリース時期については明言していません。

by Genspark


他のAIモデルとの比較

Metaの新しいAI動画生成モデル「Movie Gen」は、他の競合モデルと比較してもその性能が際立っています。特に、OpenAIの「Sora」やRunwayの「Gen-3」、Luma Labsの「Dream Machine」といった先進的なモデルと並ぶ存在として注目されています。これらのモデルはそれぞれ独自のアプローチを持ち、特に「Sora」は最大1分間の動画生成が可能で、複雑な動きやシーンの切り替えに優れています。一方で、Movie Genはテキストから最大16秒の高解像度動画を生成する能力を持ち、特に短いクリエイティブなコンテンツ制作に強みを発揮しています…

詳しい情報…by Genspark


TikTokのByteDance 動画生成AI「Doubao」シリーズ発表

引用

2024.10.03

TikTokのByteDanceが…

Sora」や「Kling AI」に匹敵する?動画生成AI「Doubao」シリーズを発表した…。

まだ…テスト段階でいじれないみたいですが…

かなり評判が高い!?ので…期待大ですね…。

Midjourneyにて生成
Midjourneyにて生成

ByteDanceの新AIモデルDoubao-PixelDanceとDoubao-Seaweed

ByteDanceは2024年9月24日に、AIビデオ生成モデルであるDoubao-PixelDanceとDoubao-Seaweedを発表しました。これらのモデルは、テキストや画像のプロンプトからビデオを生成する能力を持ち、特に企業市場をターゲットにしています。現在、これらのモデルは招待制のテスト段階にあり、限られたクリエイターのみがアクセス可能です。

Doubao-PixelDanceは複雑な動作を処理でき、最大10秒のビデオを生成することができます。一方、Doubao-Seaweedは最大30秒のクリップを生成することが可能です。これらの新しいAIモデルは、ByteDanceが長年にわたり蓄積してきた動画理解の能力を活かしており、特にDouyin(中国版TikTok)やJianying(CapCut)から得た知見が反映されています。

Doubao-PixelDanceの機能

Doubao-PixelDanceは、最大10秒の動画を生成する能力を持ち、特に短いクリエイティブなコンテンツの制作に最適です。このモデルは、ユーザーがテキストプロンプトを入力することで、瞬時に視覚的なストーリーを展開することが可能です。これにより、クリエイターはアイデアを迅速に具現化し、ソーシャルメディアや広告などの多様なプラットフォームでの利用が期待されています。

Doubao-PixelDanceは、複雑な動作やシーケンシャルな動きを処理する能力に優れています。この機能により、アニメーションやダンスなどの動きがより自然に表現され、視聴者にリアルな体験を提供します。特に、キャラクターが連続して動くシーンにおいて、その流れが途切れずにスムーズに見えることが重要です。これにより、視覚的な没入感が高まり、作品の魅力が増します…

Doubao-Seaweedの特徴

Doubao-Seaweedは、特にスタイルの多様性に優れた動画生成を行うAIモデルです。このモデルは、ユーザーが求めるさまざまなスタイルを反映させることができ、アートやエンターテインメントの分野での利用が期待されています。例えば、アニメーションや実写風の動画を生成することが可能で、クリエイターは自分のビジョンを具現化するための強力なツールを手に入れました。これにより、ユーザーは独自のスタイルを持つコンテンツを簡単に制作できるようになります。

Doubao-Seaweedは、最大30秒の動画クリップを生成する能力を持ち、これによりより長いストーリーを表現することが可能です。この機能は、特に短編映画やプロモーションビデオの制作において重要な役割を果たします。ユーザーは、30秒という限られた時間の中で、物語の起承転結をしっかりと描くことができ、視聴者の興味を引きつけることができます。これにより、クリエイティブな表現の幅が広がります…

詳しい情報…by Genspark


動画生成AI「Pika 1.5 」リリース!

引用

2024.10.03

かつて?…動画生成AIを先導していた「Pika」が…

遂に…やっと?…バージョンアップした!!!

後で…じっくり…いじってみます…。

https://pika.art/home

詳しくは… https://pikalabsai.org/pika-art-1-5/

Fluxにて生成
Midjourneyにて生成

Pika 1.5 が登場し、AIによる動画生成がさらに進化しました。

新機能と改善点

  • Pikaffects:
    • 物体を膨らませたり、溶かしたり、ケーキに変えたりと、物理法則を超えた表現が可能に。
    • 創造性を刺激する、ユニークなエフェクトが満載です。
  • 高画質・長時間動画:
    • よりリアルで滑らかな動きを実現。
    • 長尺の動画制作もスムーズに行えます。
  • 多様なスタイル:
    • アニメ、実写、ファンタジーなど、幅広いスタイルに対応。
    • あなたのアイデアを形にするための豊富な選択肢が揃っています。

Pika 1.5 でできること

  • オリジナルアニメーション:
    • キャラクターを動かして、あなただけの物語を創り出しましょう。
  • 製品プロモーション:
    • 印象的なプロモーション動画を制作し、商品をアピールできます。
  • 教育コンテンツ:
    • 複雑な概念を視覚的に分かりやすく説明する動画を作成できます。

Pika 1.5 を使ってみよう!

Pika 1.5 は、無料プランと有料プランの両方で利用できます。 あなたのアイデアを形にする、最初のステップを踏み出してみませんか?

詳細はこちら: https://pikalabsai.org/pika-art-1-5/

by Gemini


日本語性能世界一LLM「Takane」提供開始

引用

2024.10.01

Cohere LLM「Command R+」をベースに開発された…

世界一の日本語性能を持つとされる…

大規模言語モデル「Takane」の提供がいよいよ始まった…。

Midjourneyにて生成

富士通のプレスリリース: https://pr.fujitsu.com/jp/news/2024/09/30.html

富士通の「Takane」は、日本語に特化して開発された大規模言語モデル(LLM)です。世界一の日本語性能を持つとされており、様々な分野で活用が期待されています。

Takaneの特徴

  • 世界一の日本語性能: 日本語の理解力、生成能力が非常に高く、自然な文章を作成できます。
  • プライベート環境での利用: 企業が自社のデータを使って学習させることができ、セキュリティ面でも安心です。
  • 多様な業務への活用: 事務作業の自動化、問い合わせ対応、審査業務など、幅広い分野で活用できます。

Takaneの強み

  • 日本語に特化: 日本語のニュアンスや表現を深く理解しているため、より自然な文章を作成できます。
  • カスタマイズ性: 自社の業務に合わせたカスタマイズが可能で、より効率的な業務遂行に貢献します。
  • セキュリティ: プライベート環境で利用できるため、機密性の高いデータも安心して扱うことができます。

具体的な活用事例

  • 金融業界: 顧客対応の自動化、不正検知
  • 製造業: 設計図の作成、マニュアルの自動生成
  • 医療業界: 医療情報の検索、診断支援

by Gemini

Midjourneyにて生成

Takaneの使い方(一般的な手順)

  1. アカウント作成: 富士通が提供するプラットフォームでアカウントを作成します。
  2. APIキー取得: Takaneを利用するためのAPIキーを取得します。
  3. プログラミング: 取得したAPIキーを使って、自分のアプリケーションからTakaneの機能を呼び出すプログラムを作成します。
  4. プロンプト作成: Takaneに指示を与えるためのプロンプトを作成します。プロンプトの内容によって、生成される結果が大きく変わります。

プログラミング言語

Takaneは、Pythonなどの一般的なプログラミング言語で利用できます。

Takaneの主な活用例

  • 文章生成:
    • 文章の要約
    • 文章の翻訳
    • 文章の校正
    • クリエイティブな文章生成(詩、物語など)
  • 情報検索:
    • 膨大なテキストデータからの情報抽出
    • 質問応答
  • 自然言語処理:
    • 感情分析
    • 文脈理解

by Gemini


Gmailに返信メール生成AI搭載…

引用

2024.09.30

Gmailに…メールの返信内容を提案してくれる機能が追加された…

便利?ではあるが…

昨日の投稿「架電生成AI」もそうですが…

それって…本当に良いことなんですかね???

何か…おかしいぞ?って思うのは…おじさんだけ?

https://workspaceupdates-ja.googleblog.com/2024/09/gmail-gemini.html

Midjourneyにて生成
Midjourneyにて生成

Geminiがメールの返信内容を提案回答案を表示

Geminiは、Googleが開発した大規模言語モデルです。このGeminiが、Gmailに搭載され、メールの返信内容を提案してくれる機能が追加されました。これにより、メールの作成がより効率的になり、スマートなコミュニケーションが可能になります。

Geminiが提案する返信の特長

  • 文脈を理解した提案: Geminiは、メールの文脈を深く理解し、それに合った適切な返信を提案します。
  • 多様な表現: 単なる定型文ではなく、状況に応じて様々な表現で返信を提案してくれます。
  • 時間の節約: 返信内容を考える時間を短縮し、より多くのタスクに集中できます。
  • 誤字脱字の減少: Geminiが作成した返信は、文法的に正確で、誤字脱字が少ない傾向にあります。

Geminiの活用方法

Geminiの返信提案機能は、Gmailの返信画面を開くと自動的に表示されます。提案された返信をそのまま使用したり、少し修正を加えてから送信したりすることができます。

主な利用シーン

  • 返信に困ったとき: 適切な言葉が見つからない場合、Geminiの提案を参考にすると良いでしょう。
  • 迅速な返信が必要なとき: 会議の予定調整など、迅速な返信が必要な場合に役立ちます。
  • 丁寧な返信を作成したいとき: ビジネスシーンなど、丁寧な返信が必要な場合にも活用できます。

その他の機能

Geminiは、メール返信だけでなく、以下の機能も提供します。

  • メールの要約: 長文のメールを簡単に要約してくれます。
  • メールの下書き: メールの下書きを作成する際に、Geminiの提案を参考にできます。
  • メールの検索: GmailやGoogleドライブ内の情報を検索できます。

まとめ

Geminiの登場により、メールの作成はよりスマートで効率的なものになりました。Geminiの提案をうまく活用することで、より円滑なコミュニケーションを実現しましょう。

by Gemini