ニュース
NTT、動きのある3D空間情報を遠隔地にそのまま伝送する技術を開発
2024年9月25日 06:30
日本電信電話株式会社(以下、NTT)は24日、動きのある空間情報を遠隔地にそのまま伝送・再現する技術を確立し、同技術による新たなエンターテイメント体験の創出に成功したと発表した。NTTではこの成果を踏まえ、今後は技術をコミュニケーション環境などに適用することで、リアルとバーチャルの垣根を越えたユーザー体験の活用・共有を可能にし、社会全体のWell-being実現に貢献していくとしている。
同技術は、虎ノ門ヒルズ ステーションタワー内TOKYO NODE HALLで行われた配信イベント「Perfume 25th & 20th Anniversary Live Performance "IMA IMA IMA" Powered by NTT」の中で、音楽ユニットPerfumeのライブパフォーマンスを空間ごとスキャンし、3D空間データとして伝送・再現するシーンに適用された。
NTTグループでは、実世界データ(空間情報)のデジタル化について、街やモビリティの全体最適を可能にする4Dデジタル基盤や、地域が抱える課題解決に寄与するフォトリアルなメタバースに活用することを目指して、3D点群メディア処理技術の研究開発を推進してきた。しかし、これまでの技術では、元になる点群データの計測方法の特性上、対象は静的な物体に限定されており、動きのある空間情報をそのまま伝送・再現することは困難だった。
現実世界の空間を丸ごとキャプチャーして3Dモデル化し、空間内の自由な位置や角度から映像生成を可能にする方法としては、ボリュメトリックビデオ技術が知られているが、その撮影には多数のカメラが配置されたグリーンバックの専用スタジオが必要で、またその対象(被写体)は特定のオブジェクトに限定されている。
一方今回確立した「動的3D空間伝送・再現技術」では、少数のLiDARおよびカメラにより計測・撮影された膨大な3次元点群データと画像データを組み合わせることで、任意の場所・背景において、オブジェクトの動きを含む空間全体の情報を丸ごと伝送・再現できる。
将来的には、IOWNの低遅延・大容量ネットワーク(APN:All-Photonics Network)を活用することで、膨大な動きのある空間情報を瞬時に双方向で共有できるようになる。これにより、都市や作業現場のモニタリング、災害対策や都市計画のシミュレーションだけでなく、遠隔のチームとのコラボレーション、そしてリアルタイムでフィードバックを行えるメタバース環境を実現していくとしている。
開発した「動的3D空間伝送・再現技術」では、その要素技術の一つであるリアルタイム3Dデータ高解像度化技術により、高密度な動的3D空間の伝送・再現を実現している。LiDARはレーザー反射から点群の位置を計測する機構のため、単位時間当たりに取得可能な点数に物理的な限界がある。そのため、動きのある物体では、点群データが極めて疎になり、形状の再現が困難という問題があった。
そこでNTTでは、点群データと同時に別カメラで収録された画像データをもとに、色と奥行きの対応関係を学習することで、疎な点群データを高速に高密度化する機械学習ベースの技術を新たに開発した。同技術では、点群データの高密度化処理に画像フィルタ処理の考えを導入しているが、当該処理を直接畳み込み層に表現することで、従来技術と比較して機械学習のパラメーター数を約1000分の1にまで小型化した。この軽量な機械学習モデルにより、処理速度を従来より約6倍高速化した。この結果、市販のLiDARで計測されるデータの空間解像度について、リアルタイム処理で約20倍の高解像度化を実現している。
NTTでは、今後は空間解像度だけでなく、より滑らかな動的3D空間の伝送・再現を目指し、フレームレートの向上に取り組む予定と説明。また、現実世界に含まれる振動など触覚に代表されるその他の五感情報を含めてアクセス可能な、没入感の高いリアル・バーチャル融合空間を創出し、都市の精緻なシミュレーションや超高臨場なコミュニケーションに適用することで、人と人、人と社会の「つながり」の質を高め、多様性を受容できる豊かな社会の実現を目指していくとしている。