画像から高解像度3D深度マップを高速生成「Depth Pro」

2024.10.08

AppleのAI研究チームが…単一の画像から高解像度の3D深度マップを高速に生成できる「Depth Pro」をリリースした…

画像の奥行きを推定して…3D空間を創出できちゃう…

最近注目の…画像深度推定技術

既に…複数の生成AIサービスがありますが…

どうやら…Appleの「Depth Pro」は…優れものらしい…

GitHubで公開中… https://github.com/apple/ml-depth-pro

Flux 1.1にて生成
Flux 1.1にて生成

AppleのAI研究チームは、2024年10月4日に新しいAIモデル「Depth Pro」を発表しました。このモデルは、深度(奥行き)を認識する方法を大幅に進化させるもので、特に単一の画像から高解像度の3D深度マップをわずか0.3秒で生成できる点が特徴です。Depth Proは、他のモデルでは捉えきれない細かいディテール、例えば髪の毛や草木などを正確に認識する能力を持っています。

Depth Proの主な特徴には以下が含まれます:

  • メトリック深度: 相対的な深度と絶対的な深度を推定する能力があり、拡張現実(AR)などのアプリケーションにおいて重要な実世界の測定値を提供します。
  • リアルタイム処理: 標準的なGPUで動作し、225万ピクセルの深度マップを迅速に生成します。
  • オープンソース: Depth Proのコードとモデルの重みはGitHubで公開されており、研究者や開発者がこの技術を利用してさらなる開発を行うことができます。

この技術は、自動運転車やロボティクス、製造業、ヘルスケアなど多くの分野での応用が期待されています。特に、自動運転車ではリアルタイムで周囲の深度を推定することで安全性が向上する可能性があります。また、家具が部屋にフィットするかどうかを確認するためにスマートフォンのカメラを使用することも可能になるでしょう。

Depth Proは、従来の深度推定モデルと比較して精度と速度で優れており、特に物体の境界線を鮮明に描写する能力が高いとされています。これにより、医療画像処理や画像マッティングなど、精密なオブジェクトセグメンテーションが必要なアプリケーションでも効果的です。

by Genspark


New Posts: