2024.10.18
最大4096×4096ピクセルの高解像度画像を数秒以内に生成できる能力を持つ…
テキストから高品質な画像を生成することに特化した…
最新の画像生成AI「Sana」が発表された…。
4096×4096ピクセルって…
1024×1024ピクセルの画像をわずか0.9秒で生成することができるって…
こうなってくると…どうなっちゃうんだ???
Sanaの技術的な特徴として、従来のオートエンコーダーと異なり、最大32倍圧縮可能なオートエンコーダーを使用しており、これにより効率的なトレーニングと高解像度画像の生成が実現されています。また、Gemmaという言語モデルをデコーダー専用に利用することで、プロンプトの理解力と推論能力が向上しています。このアプローチにより、従来のT5モデルよりも優れたテキスト理解力を持ち、画像とテキストのアライメントが改善されています。
さらに、Sanaはサンプリングステップを削減するために「Flow-DPM-Solver」を導入しており、この結果、サンプリングステップの数が大幅に減少し、効率的なキャプションラベリングと選択が可能になっています。具体的には、4096×4096ピクセルの画像を15.9秒で生成できる一方で、1024×1024ピクセルの画像は1秒未満で生成できます1。
Sanaはその性能から、多くの企業や開発者に注目されており、比較的低スペックのコンピュータでも動作可能です。これにより、高速かつ高品質な画像生成が求められるさまざまな分野で活用されることが期待されています。
by Genspark
New Posts:
動画生成AI「Sora」一般提供開始 → 新規登録を即日停止
Googleの動画生成モデル「Veo」が使える!?
Googleの3D空間環境生成AI「Genie 2」
テキストや画像から高品質な3Dモデルを迅速に生成する「Edify 3D」
新たな脅威...ビジュアルプロンプトインジェクション攻撃とは...
Dream Machine サイトリニューアル
人物画像生成特化型AI「FLUX Portrait Trainer」
「FLUX1.1 Pro」で使える...「FLUX.1 Tools」登場
1枚の画像から空間を生成!?「DimensionX」
AI生成された画像からプロンプトを抽出する...
最高性能?のアップスケール画像生成AI「DreamClear」
生成AI検索に移行する中...Google Search Consoleに意味はあるのか?
プロンプトキャッシングって?
アプローチが新しい!?マルチモーダル画像生成AI「OmniGen」
GitHub Copilotってなに?
Runway Gen-3 Alphaの進化...
実写動画を3DCGアニメーションに変換「Wonder Animation」
Adobe Firefly Generate Video...まもなく...
プログラミング知識不要でAIアプリケーション開発できる「Dify」
コンピューターを操作することができる生成AI「Claude 3.5 Sonnet」
Midjourney...新外部画像エディターについて
Haiper 2.0...登場!
3種のStable Diffusion 3.5 リリース
高品質な短編動画を効率的に生成する動画生成AI「Pyramid Flow」
文書、テキスト、画像などを構造化データに変換するOmniAIのOCRデモ
イチゴが苦手な!?大規模言語モデル(LLM)
電子インボイス国際的標準規格「Peppol」
MidjourneyのWeb画像エディターが新しくなる?
画像から音楽を生成するSuno AI「Scene」
Adobeの2024年10月14日リリースから「Adobe Firefly Video Model」「Project Neo」
Geminiで画像生成AI「Imagen 3」が使えるように!
Adobe...デジタル署名?発表
生成AI×スマートグラス=個人情報丸見え!?
画像から高解像度3D深度マップを高速生成「Depth Pro」
開発者向けの生成AIプラットフォーム「fal.ai」
人間やキャラクターを動画に合成できるビデオ合成AI「MIMO」
Meta 新しいAI動画生成モデル「Movie Gen」発表
TikTokのByteDance 動画生成AI「Doubao」シリーズ発表
動画生成AI「Pika 1.5 」リリース!
生成AI検索に対応した要約しやすいWebサイトとは?
日本語性能世界一LLM「Takane」提供開始
Gmailに返信メール生成AI搭載...
代わりに電話をかけてくれるAIサービス
多様な画像生成タスクを統合「OmniGen」
人に説明するのも...生成AIに指示を出すのも...
もはや...作業や処理は生成AIに任せ方が...
日本人には縁遠い?「Llama」がアップデート
より人間らしく…「Advanced Voice Mode」公開
AIで「縁結び」スタート...東京都
「生成AIガチャ」と言われる段階で...
詐欺メールの削除から始まる日常
フリーランス保護新法 施行で...単価が上がる?
「MemoRAG」が生成AIを進化させる
図解生成AI「Napkin」が日本語に対応
1080p HDに対応したKLING 1.5
YouTubeがVeoを統合...6秒の動画生成が可能に
Adobe Premiereが最強になる日?
SUNO ベータ版 新機能「Covers」
主なリップシンク生成AIサービス
ブレインストーミングが一人で出来ちゃう...