生成AI画像の多くは…何故?カメラ目線なのか

2024.08.02

どうして…自分は…Midjourney推し?なのか…

改めて…今まで生成した画像を見比べてみると…

Midjourney以外は…カメラ目線が多い事に気付いた…。

臨場感や奥行きが伝わって来ない理由は…

カメラ目線だから…ボーズを決めてるから…なのかも?

何故?カメラ目線が多いのか…Geminiに聴いてみた…

Microsoft Designerにて生成
Microsoft Designerにて生成

生成AI画像がカメラ目線になりやすい理由は、いくつかの要因が考えられます。

1. 学習データの影響:

  • 既存画像の偏り: 生成AIは、大量の既存画像を学習して新たな画像を生成します。既存の画像データには、人物がカメラを見ているものが多く含まれているため、生成される画像もその傾向を強く反映します。
  • 顔認識の技術: 顔認識技術は、顔の向きや目線を特定することに長けています。生成AIが顔認識技術を応用することで、より自然な顔の向きや目線を生成できるようになっています。

2. コミュニケーションの観点:

  • 視線の方向がコミュニケーションに与える影響: 人間のコミュニケーションにおいて、視線の方向は非常に重要な役割を果たします。カメラ目線は、相手に対して直接話しかけているように感じさせ、親近感や信頼感を高める効果があります。
  • 肖像画の伝統: 古くから肖像画では、人物が正面を向き、観る者に直接語りかけているような構図が好まれてきました。この伝統的な表現が、生成AIの画像生成にも影響を与えている可能性があります。

3. 技術的な制約:

  • 複雑なポーズの生成: カメラ目線以外のポーズ、例えば横顔や後ろ姿などは、生成AIにとってまだ難しい場合があります。これは、複雑なポーズを表現するためのデータが不足していることや、生成モデルの複雑さが影響していると考えられます。

4. 利用者の好み:

  • 自然な表現への期待: 利用者は、生成AIによって生成された画像が、より自然で人間らしい表現であることを期待します。カメラ目線は、その期待に応えるためのひとつの手段と言えるでしょう。

まとめ:

生成AI画像がカメラ目線になりやすい理由は、学習データの偏り、コミュニケーションの観点、技術的な制約、利用者の好みなど、様々な要因が複雑に絡み合っていると考えられます。

補足:

  • 多様な画像生成: 近年の生成AIの進化により、カメラ目線以外の画像も生成できるようになってきています。
  • プロンプトによる制御: 生成AIに指示を与えるプロンプトを工夫することで、カメラ目線以外の画像を生成することも可能です。

by Gemini