生成AI画像の多くは…何故?カメラ目線なのか

2024.08.02

どうして…自分は…Midjourney推し?なのか…

改めて…今まで生成した画像を見比べてみると…

Midjourney以外は…カメラ目線が多い事に気付いた…。

臨場感や奥行きが伝わって来ない理由は…

カメラ目線だから…ボーズを決めてるから…なのかも?

何故?カメラ目線が多いのか…Geminiに聴いてみた…

Microsoft Designerにて生成
Microsoft Designerにて生成

生成AI画像がカメラ目線になりやすい理由は、いくつかの要因が考えられます。

1. 学習データの影響:

  • 既存画像の偏り: 生成AIは、大量の既存画像を学習して新たな画像を生成します。既存の画像データには、人物がカメラを見ているものが多く含まれているため、生成される画像もその傾向を強く反映します。
  • 顔認識の技術: 顔認識技術は、顔の向きや目線を特定することに長けています。生成AIが顔認識技術を応用することで、より自然な顔の向きや目線を生成できるようになっています。

2. コミュニケーションの観点:

  • 視線の方向がコミュニケーションに与える影響: 人間のコミュニケーションにおいて、視線の方向は非常に重要な役割を果たします。カメラ目線は、相手に対して直接話しかけているように感じさせ、親近感や信頼感を高める効果があります。
  • 肖像画の伝統: 古くから肖像画では、人物が正面を向き、観る者に直接語りかけているような構図が好まれてきました。この伝統的な表現が、生成AIの画像生成にも影響を与えている可能性があります。

3. 技術的な制約:

  • 複雑なポーズの生成: カメラ目線以外のポーズ、例えば横顔や後ろ姿などは、生成AIにとってまだ難しい場合があります。これは、複雑なポーズを表現するためのデータが不足していることや、生成モデルの複雑さが影響していると考えられます。

4. 利用者の好み:

  • 自然な表現への期待: 利用者は、生成AIによって生成された画像が、より自然で人間らしい表現であることを期待します。カメラ目線は、その期待に応えるためのひとつの手段と言えるでしょう。

まとめ:

生成AI画像がカメラ目線になりやすい理由は、学習データの偏り、コミュニケーションの観点、技術的な制約、利用者の好みなど、様々な要因が複雑に絡み合っていると考えられます。

補足:

  • 多様な画像生成: 近年の生成AIの進化により、カメラ目線以外の画像も生成できるようになってきています。
  • プロンプトによる制御: 生成AIに指示を与えるプロンプトを工夫することで、カメラ目線以外の画像を生成することも可能です。

by Gemini


New Posts:
動画生成AI「Sora」一般提供開始 → 新規登録を即日停止
Googleの動画生成モデル「Veo」が使える!?
Googleの3D空間環境生成AI「Genie 2」
テキストや画像から高品質な3Dモデルを迅速に生成する「Edify 3D」
新たな脅威...ビジュアルプロンプトインジェクション攻撃とは...
Dream Machine サイトリニューアル
人物画像生成特化型AI「FLUX Portrait Trainer」
「FLUX1.1 Pro」で使える...「FLUX.1 Tools」登場
1枚の画像から空間を生成!?「DimensionX」
AI生成された画像からプロンプトを抽出する...
最高性能?のアップスケール画像生成AI「DreamClear」
生成AI検索に移行する中...Google Search Consoleに意味はあるのか?
プロンプトキャッシングって?
アプローチが新しい!?マルチモーダル画像生成AI「OmniGen」
GitHub Copilotってなに?
Runway Gen-3 Alphaの進化...
実写動画を3DCGアニメーションに変換「Wonder Animation」
Adobe Firefly Generate Video...まもなく...
プログラミング知識不要でAIアプリケーション開発できる「Dify」
コンピューターを操作することができる生成AI「Claude 3.5 Sonnet」
Midjourney...新外部画像エディターについて
Haiper 2.0...登場!
3種のStable Diffusion 3.5 リリース
高品質な短編動画を効率的に生成する動画生成AI「Pyramid Flow」
文書、テキスト、画像などを構造化データに変換するOmniAIのOCRデモ
イチゴが苦手な!?大規模言語モデル(LLM)
電子インボイス国際的標準規格「Peppol」
MidjourneyのWeb画像エディターが新しくなる?
画像から音楽を生成するSuno AI「Scene」
4096×4096ピクセルの高解像度画像を数秒以内に生成できる「Sana」
Adobeの2024年10月14日リリースから「Adobe Firefly Video Model」「Project Neo」
Geminiで画像生成AI「Imagen 3」が使えるように!
Adobe...デジタル署名?発表
生成AI×スマートグラス=個人情報丸見え!?
画像から高解像度3D深度マップを高速生成「Depth Pro」
開発者向けの生成AIプラットフォーム「fal.ai」
人間やキャラクターを動画に合成できるビデオ合成AI「MIMO」
Meta 新しいAI動画生成モデル「Movie Gen」発表
TikTokのByteDance 動画生成AI「Doubao」シリーズ発表
動画生成AI「Pika 1.5 」リリース!
生成AI検索に対応した要約しやすいWebサイトとは?
日本語性能世界一LLM「Takane」提供開始
Gmailに返信メール生成AI搭載...
代わりに電話をかけてくれるAIサービス
多様な画像生成タスクを統合「OmniGen」
人に説明するのも...生成AIに指示を出すのも...
もはや...作業や処理は生成AIに任せ方が...
日本人には縁遠い?「Llama」がアップデート
より人間らしく…「Advanced Voice Mode」公開
AIで「縁結び」スタート...東京都
「生成AIガチャ」と言われる段階で...
詐欺メールの削除から始まる日常
フリーランス保護新法 施行で...単価が上がる?
「MemoRAG」が生成AIを進化させる
図解生成AI「Napkin」が日本語に対応
1080p HDに対応したKLING 1.5
YouTubeがVeoを統合...6秒の動画生成が可能に
Adobe Premiereが最強になる日?
SUNO ベータ版 新機能「Covers」
主なリップシンク生成AIサービス