Meta「Llama 4」リリース

2025.04.06

Metaが…テキストだけでなく…
画像や動画などの多様なメディア情報を処理できるマルチモーダル機能を備え従来のモデルよりも幅広いタスクに対応可能な…
最新の大規模言語モデル「Llama 4」をリリースした…。

大規模言語モデルは数あるけれど…
GPT・PaLM・LLaMA・Claude・Mistral・Gemini・DeepSeek・BLOOM…
どこが勝ち抜くんだろう…

https://ai.meta.com/blog/llama-4-multimodal-intelligence

Fluxにて生成

Llama 4のモデル構成

Llama 4は、以下の3つの主要なモデルで構成されています。

  • Llama 4 Scout: 17億のアクティブパラメータを持ち、16の専門家を活用するモデルです。特に、最大1000万トークンのコンテキストウィンドウをサポートしており、長文の処理や複雑な会話に適しています。
  • Llama 4 Maverick: 同じく17億のアクティブパラメータを持ち、128の専門家を使用します。このモデルは、マルチモーダル処理や多言語対応、コーディング能力に優れ、コストパフォーマンスも高いとされています。
  • Llama 4 Behemoth: 現在訓練中のこのモデルは、2880億のアクティブパラメータを持ち、最も強力なモデルとして位置付けられています。STEM(科学・技術・工学・数学)分野においても高い性能を発揮します。

技術的特徴

Llama 4は、Mixture of Experts(MoE)アーキテクチャを採用しており、これにより計算効率が大幅に向上しています。具体的には、トークンごとに必要な専門家のみをアクティブにすることで、推論速度が40%以上向上しています。また、最大1000万トークンのコンテキストウィンドウを持つことで、長い会話や大規模な文書の処理が可能です。

オープンソースとアクセス

MetaはLlama 4をオープンソースとして提供しており、開発者や研究者が自由に利用できるようにしています。Llama 4 ScoutとMaverickは、Metaのパートナーやプラットフォームを通じて利用可能で、特にAI開発プラットフォームであるHugging Faceなどからアクセスできます。
このように、Llama 4は最新のAI技術を駆使したモデルであり、さまざまな応用が期待されています。

Llama 4の画像生成機能

  • マルチモーダル処理: Llama 4は、最大8枚の画像を同時に処理する能力があり、内部的には最大48枚の画像フレームでテストされています。これにより、複雑な視覚的タスクに対応することが可能です。
  • 画像理解と生成: Llama 4は、視覚的推論や画像に関する質問応答を行うために設計されており、ユーザーのプロンプトに基づいて関連する視覚的概念を特定し、画像内の特定の領域に応答をアンカーする能力があります。これにより、より正確な視覚的質問応答が実現されます。
  • 性能と応用: Llama 4の「Scout」モデルは、17億のアクティブパラメータを持ち、特に画像認識や関連付け機能に優れています。また、長いコンテキストウィンドウ(最大1000万トークン)をサポートしており、これにより多様なタスクへの応用が可能です。
  • 画像生成の限界: 一方で、Llama 4の画像生成機能は、現在のところ主にアメリカと英語圏に限定されており、他の国での展開についてはまだ情報がありません。また、生成された画像の質については、他の競合モデルと比較して改善の余地があるとの意見もあります。

Llama 4は、テキストと画像を組み合わせた高度なAIアプリケーションの開発を可能にし、特に視覚的な情報を扱うタスクにおいて強力なツールとなることが期待されています。

by Felo

Midjourneyにて生成

New Posts:

1枚の静止画と音声データから動画を生成「FantasyTalking」

2025-04-23

「Veo 2」がGemini AdvancedとWhiskでつかえる!

2025-04-20

自然言語でWebアプリケーションを生成「Firebase Studio」

2025-04-19

自然言語と音声入力からキャラクターアニメーションを生成「MoCha」

2025-04-16

Amazon「Nova」って?

2025-04-14

PROPMAN DESIGN LLC. 生成AIラボ

2025-04-12

Google...音楽生成AI「Lyria」登場!

2025-04-12

「Tripo」...3D生成AIのスタンダードになるのか!?

2025-04-10

生成AI活用による広告の現在地

2025-04-08

AdobeでFlux・fal・Veo2・Imagen3・Runwayが使える!

2025-04-07

複数の異なる画像に写る人や物を整合性をとって1枚の画像に統合「UNO」

2025-04-06

テキストや画像から高品質なSVG画像を生成「OmniSVG」

2025-03-22

アニメスタイル画像生成に特化した「NovelAI Diffusion V4 Full」

2025-03-22

静止画からリアルな奥行きと遠近感を持つ高品質な3D動画を生成する「Stable Virtual Camera」

2025-03-22

数枚の画像を組み合わせて自然な動画を生成「SkyReels-A2」

2025-03-22

中国発...世界初の通用型AIエージェント「Manus」

2025-03-22

1枚の画像を参考動画と同じ動きに「DreamActor-M1」

2025-03-22

2D画像から3Dモデルを高速で生成するオープンソースソフトウェア「CUMVS」

2025-03-15

複雑な動きやシーンをリアルに再現...動画生成AI「Wan 2.1」

2025-03-09

映画やテレビで訓練された動画生成AI「SkyReels V1」

2025-03-09

3D空間でオブジェクトやカメラを操作!?動画生成AI「CineMaster」

2025-03-02

AIコンパニオンが…人格を支配する

2025-02-28

SEOからGAIOへ

2025-02-24

広告・マーケティング活用に期待!?動画生成AI「Goku」「Goku+」

2025-02-22

ゲームが創れる!?生成AI「Muse」

2025-02-21

曲に合わせ画像が唄う!?...動画生成AI「OmniHuman-1」

2025-02-16

Adobeバリアブルフォント「百千鳥 VF」をいじってみた!

2025-02-15

スケッチで画像を編集できる!?「FramePainter」

2025-02-06

結局のところ…「Adobe」一択

2025-02-02

AIデザインツール「Kittl」

2025-01-17

「Stable Point Aware 3D」...画像を1秒で3Dモデル化

2025-01-15

あけましておめでとうございます。

2025-01-06

Gemini × Imagen3 = 画像生成AIアプリ「Whisk」

2024-12-18

画像生成AI「Midjourney」アップデート...Profiles and Moodboards

2024-12-17

Google...動画生成AI「Veo 2」リリース

2024-12-17

Midjourney...複数ユーザーがストーリーを共有できる「Patchwork」発表

2024-12-15

動画生成AI「Sora」一般提供開始 → 新規登録を即日停止 → 新規登録再開

2024-12-14

Adobeが写真に写り込む反射を除去できる「Reflection Removal tool」を発表

2024-12-14

Stable Diffusionと連携してブラウザ上で漫画制作できる「Manga Editor Desu!」

2024-12-13

Googleの動画生成モデル「Veo」が使える!?

2024-12-08

Googleの3D空間環境生成AI「Genie 2」

2024-12-08

テキストや画像から高品質な3Dモデルを迅速に生成する「Edify 3D」

2024-12-07

新たな脅威...ビジュアルプロンプトインジェクション攻撃とは...

2024-12-01

Dream Machine サイトリニューアル

2024-12-01

人物画像生成特化型AI「FLUX Portrait Trainer」

2024-12-01

「FLUX1.1 Pro」で使える...「FLUX.1 Tools」登場

2024-11-23

1枚の画像から空間を生成!?「DimensionX」

2024-11-17

AI生成された画像からプロンプトを抽出する...

2024-11-15

最高性能?のアップスケール画像生成AI「DreamClear」

2024-11-12

生成AI検索に移行する中...Google Search Consoleに意味はあるのか?

2024-11-08

プロンプトキャッシングって?

2024-11-05

アプローチが新しい!?マルチモーダル画像生成AI「OmniGen」

2024-11-04

GitHub Copilotってなに?

2024-11-03

Runway Gen-3 Alphaの進化...

2024-11-02

実写動画を3DCGアニメーションに変換「Wonder Animation」

2024-11-01

Adobe Firefly Generate Video...まもなく...

2024-10-28

プログラミング知識不要でAIアプリケーション開発できる「Dify」

2024-10-28

コンピューターを操作することができる生成AI「Claude 3.5 Sonnet」

2024-10-27

Midjourney...新外部画像エディターについて

2024-10-24

Haiper 2.0...登場!

2024-10-23

3種のStable Diffusion 3.5 リリース

2024-10-23

高品質な短編動画を効率的に生成する動画生成AI「Pyramid Flow」

2024-10-22

文書、テキスト、画像などを構造化データに変換するOmniAIのOCRデモ

2024-10-21

イチゴが苦手な!?大規模言語モデル(LLM)

2024-10-20