MR整合現(xiàn)實與虛擬創(chuàng)造元宇宙數(shù)字生態(tài)系

—— 更深一層的軟硬件整合

作者：時間：2022-05-29 來源：CTIMES

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

在Connect2021的開發(fā)者大會上，F(xiàn)acebook公布了Metaverse計劃，構(gòu)筑出基于元宇宙的下一代3D空間社交網(wǎng)絡(luò)平臺。此后，元宇宙被視為現(xiàn)實空間和虛空間的融合，未來人們可以在這里展開互動和各種商業(yè)。同時Meta（Facebook母公司）也將Metaverse定位為下一個行動平臺，繼Apple和Google之后，又另一新創(chuàng)建的網(wǎng)絡(luò)平臺。

Meta構(gòu)建元宇宙的基礎(chǔ)技術(shù)與概念是，整合增強實境（AR）和虛擬現(xiàn)實（VR）后所產(chǎn)生混合實境（MR）。而這些MR相關(guān)的應(yīng)用技術(shù)都在元宇宙研究所「Facebook Reality Labs」積極的開發(fā)中。

創(chuàng)造虛擬世界的技術(shù)：Presence Platform
Meta開發(fā)的Metaverse是期望讓現(xiàn)實社會和虛擬社會的平滑融合，而創(chuàng)造出這種社會的技術(shù)則被稱為「Presence Platform」。這個平臺是以視覺運算和人工智能為核心，將虛擬對象整合到現(xiàn)實空間的數(shù)據(jù)處理模塊。具體來說，它提供了產(chǎn)生MR、對象互動和語音互動的能力。如前所述，MR是一種混合實境的環(huán)境，融合了真實空間和虛空間，成為元宇宙的核心功能。

Presence Platform 由三個SDK組成，包括了「Insight SDK」：在現(xiàn)實空間中嵌入虛擬對象來產(chǎn)生MR環(huán)境的技術(shù)?！窱nteraction SDK」：手動操作虛擬對象的技術(shù)?！竀oice SDK」：使用對話語音來對虛擬對象進行操控的技術(shù)。

圖片.png

圖一 : Mixed Reality 全球市場規(guī)模預(yù)測(兆日圓)。(source：PWC；作者整理)

MR空間生成技術(shù)：Insight SDK
Insight SDK是元宇宙的核心技術(shù)，目的在產(chǎn)生高質(zhì)量的MR空間。Insight SDK包含兩個函數(shù)，「Passthrough」和「Spatial Anchors」，以及Scene Understanding功能。

Passthrough是一種透過VR耳機來創(chuàng)建出MR空間，并在現(xiàn)實空間中描繪虛擬物體的技術(shù)。圖二顯示了利用「Oculus Quest 2」來進行鋼琴課程。鋼琴鍵盤上會顯示一個圓形的虛擬對象，操作者可以用手指輕敲它來播放音樂。

同時，「Oculus Quest 2」還內(nèi)建了攝影鏡頭，可以黑白方式看到前方的影像。因此，「Oculus Quest 2」不僅可以用作VR，還可以用以當作MR玻璃。

圖片.png

圖二 : 透過MR技術(shù)將實體物品與虛擬圖像結(jié)合后進行鋼琴課程。(source：META)

Spatial Anchors是一種透用手機映像出真實空間的功能。它能利用Oculus手機，讓操作者利用手指沿著家具移動，繪制出房間內(nèi)部的地圖。經(jīng)由這個功能，可以了解真實空間的結(jié)構(gòu)，并顯示出相對應(yīng)的虛擬對象。

Scene Understanding是對用戶空間進行理解的功能，判斷出空間的位置關(guān)系及其意義。使用此場景模型時，可在房間中建立出一個MR空間。

利用這種方式，可以整合Passthrough、Spatial Anchors和 Scene Understanding來開發(fā)可判斷物理空間含義的高度復雜Metaverse。

表達手部動作的技巧：Interaction SDK
Interaction SDK是針對手或手機在虛空間中移動的處理和控制操作，例如用手抓握、觸摸和指向虛擬對象。圖三顯示了一個虛擬的咖啡杯被用手抓著。Interaction SDK是利用視覺運算、AI追?手部動作并判斷出與對象的互動程度。

圖片.png

圖三 : 一個虛擬的咖啡杯被用手抓著。(source：META)

理解語音的技巧：Voice SDK
Voice SDK是一種自然語言分析功能，可透過聲音來進行語音操控。當應(yīng)用于游戲時，可以透過語音來進行操控。除了語音導航外，Voice SDK還提供語音搜索和語音問答功能。例如當操作者說出虛擬角色的名字「Oppy」時，系統(tǒng)就會明白這個詞的意思并接近它。

行動MR技術(shù)正積極被開發(fā)
行動MR具有許多明顯的優(yōu)勢，因此備受全球所注目，也吸引了相當多業(yè)者投入開發(fā)相關(guān)的各項技術(shù)。目前許多潛在的用戶已經(jīng)擁有一款可支持MR的智能型手機，因此無需耗費金錢購買昂貴且笨重的耳機。就其本質(zhì)而言，今天的行動設(shè)備已經(jīng)非常便于攜帶，也相當容易進入任何空間。

Apple ARKIT 5
Apple的最新版本AR/MR開發(fā)工具集開放原始碼行動ARKit5，進行了重大改進。其中最重要的功能，包括對位置錨點(Anchors)的擴充支原、改進的運動追?，以及在超廣角攝影鏡頭中可提供更好的臉部跟?，App Clip Codes還可支持快速掃描啟動體驗。

自從在ARKit 4中加入位置錨點后，允許APP開發(fā)人員可以將具有特定緯度、經(jīng)度和高度的虛擬對象放置在屏幕上，并且可相對于現(xiàn)實環(huán)境中的位置。例如，位置錨點可在標志性建筑旁邊的空間中，顯示三維圖標或文字。在ARKit 5中，此功能的支持性已擴展到倫敦和美國的其他城市。

擴充的臉部追?技術(shù)，允許一次最多追?三個人的臉部，現(xiàn)在可支持所有配備A12Bionic處理器，以及更高版本的設(shè)備，即使沒有真深度鏡頭(TrueDepth Camera)也可以應(yīng)用。

而App Clip Codes則是應(yīng)用在類似于QR Code的影像，可以透過掃描來啟動APP的lightweight，并且能與 ARKit整合，允許從任何地方啟動AR/MR，而無需下載其他軟件。

Google ARCORE
Android的ARKit-ARCore提供了開發(fā)人員在Android設(shè)備上，雖然可以開發(fā)出AR/MR APP所需的開放原始碼工具集，但由于需要注意Android設(shè)備上各種硬件的兼容性，因此這通常被視為也些挑戰(zhàn)性。

2021年，Google在ARCore中加入了一些新功能，例如錄制和播放API等。這些功能可以讓開發(fā)人員使用AR原始數(shù)據(jù)錄制視訊片段，在透過深度和IMU運動傳感器數(shù)據(jù)，來以重新建立與視訊中相同的環(huán)境，同時也為開發(fā)人員能更輕松地測試特定環(huán)境的方式。

錄制和播放API不僅是開發(fā)人員所需要，對使用者來說也有一定的用處，這項技術(shù)提供用戶可以錄制視訊，應(yīng)用在以后的AR/MR效果中，因為這些視訊可以包含環(huán)境原始數(shù)據(jù)。

ARKit和ARCore之間的競爭并不如外界想象中的明顯。由于APPLE掌控了所有的設(shè)備組件，因此ARKit在軟件和硬件之間有著較佳的兼容性。但是在市場上，并非每個使用者都擁有iPhone或iPad。因此對于其他的用戶或行動產(chǎn)品業(yè)者來說，ARCore就變得非常重要。盡管由于采用的硬件的不同，不能保證每臺Android設(shè)備都能獲得完全支持和兼容，但Google仍舊盡可能讓其眾多用戶擁有一定程度的競爭力。

就實際效能而言，這兩個平臺背后的技術(shù)幾乎是一樣的。例如，對于場景檢測等應(yīng)用，這兩種技術(shù)使用相同的方法，但差異最大還是在硬件的部分，與兼容能力。

手機增強實境：Spark AR
Spark AR是一款針對行動終端的AR/MR開發(fā)環(huán)境，這款行動終端AR/MR，可以整合到智能手機的APP中來使用。例如，Spark AR可應(yīng)用在臉部插入特殊效果，像是用Spark AR對臉部進行特殊化妝，并將其轉(zhuǎn)變?yōu)楣治锏膽?yīng)用。

Project Aria
Meta也正在開發(fā)AR/MR眼鏡「Project Aria」。這是一個在眼鏡上內(nèi)建攝影鏡頭和顯示器產(chǎn)品，并在面前的真實空間中強行加入一個虛擬對象。AR/MR眼鏡可被當數(shù)字助理應(yīng)用，透過AI來了解周圍物體的類型和含義，例如識別沙發(fā)和桌子。此外，也可利用人工智能掌握用戶的想法，并協(xié)助進行下一步行動。例如，當操作者看著燈時，開關(guān)就會被自動打開。

智能眼鏡的輸入：Electromyography
但是挑戰(zhàn)在于如何將數(shù)據(jù)輸入AR/MR眼鏡，因此Meta正在開發(fā)一種稱為Electromyography(肌電圖)的技術(shù)。

這個想法是將設(shè)備戴在手腕上后，并測量肌電圖，再透過人工智能分析肌肉中產(chǎn)生的弱電場來預(yù)測操作者的意圖。例如當您用手指書寫字母時，此設(shè)備會將其轉(zhuǎn)換為文字（圖四）。

圖片.png
圖四 : 利用肌肉的電位變化轉(zhuǎn)換稱操控方式。(source：META)

MR在工業(yè)領(lǐng)域的潛力和未來
第一個實現(xiàn)MR的產(chǎn)品是，HoloLens于2015年1月所發(fā)布的產(chǎn)品。這是一款無需外接控制器的獨立頭戴式顯示器，可透過手部追?和語音輸入進行操作。HoloLens的產(chǎn)品透過攝影鏡頭和深度傳感器，來對周圍環(huán)境進行識別，并經(jīng)由透射式顯示器在真實空間中加迭內(nèi)容來提供新體驗的設(shè)備。

隨后，Magic Leap One也于2017年12月發(fā)表一款新技術(shù)，將需要處理數(shù)據(jù)的機制，轉(zhuǎn)移到外部的獨立計算設(shè)備，大幅度減輕顯示器的重量，并且利用數(shù)字內(nèi)容，以更真實的方式強化顯示能力，例如擴大視角，和根據(jù)視線切換影像，在發(fā)表之后便大大威脅HoloLens的領(lǐng)先地位。

面對此一挑戰(zhàn)，HoloLens也于2年后發(fā)表第二代產(chǎn)品-HoloLens 2。與初代的HoloLens相比，無論是顯示視角、縱橫比、分辨率、運算和佩戴感等，多項性能都獲得了大幅度的提升。此外，傳感器的加入更使得佩戴者五根手指的動作都可以被檢測到，來達到捏握等全影像操作，提高了實用性。

雖然這些主要用于工業(yè)用途的MR設(shè)備，性能相當卓越，但價格卻是非常昂貴。因此針對消費者使用的MR設(shè)備商品化更是備受期待，市場上終于在2020年8月，出現(xiàn)了一款專為消費者使用而開發(fā)的MR產(chǎn)品-Nreal Light。這款產(chǎn)品可與智能型手機連接，將處理數(shù)據(jù)的工作轉(zhuǎn)移到智能型手機，來達到減輕頭戴式顯示器重量，雖然在攝影鏡頭數(shù)量、畫素數(shù)、環(huán)境偵測與掌握，和各種跟?的精度等性能方面不如工業(yè)設(shè)備，但它實現(xiàn)了大幅降低售價，讓消費者在低價格負擔下就能輕松體驗MR(表一)。

MR技術(shù)的未來
未來將有很多業(yè)者進入MR設(shè)備市場，透過提高性能和減輕重量來增強現(xiàn)有產(chǎn)品，就像前述高整合度的HoloLens 2。雖然頭戴式顯示器是目前MR設(shè)備的主流，但掛戴眼鏡式和隱形眼鏡式等，無需考慮佩戴舒適度的顯示器設(shè)備，也有業(yè)者積極的投入開發(fā)。不過，目前MR的主要用途主要是還是工業(yè)用，根據(jù)PWC預(yù)測工業(yè)用市場短期內(nèi)將會持續(xù)擴大。

從中長期來看，市場有機會在各種應(yīng)用領(lǐng)域擴大，例如數(shù)字內(nèi)容和虛擬全影像顯示、醫(yī)療領(lǐng)域醫(yī)師與患者僅行互動、減壓和復健等醫(yī)療，都將可在MR平臺上僅行。此外，MR在娛樂應(yīng)用和商業(yè)產(chǎn)業(yè)的應(yīng)用也將進一步擴大，因此不僅工業(yè)市場，包括普通消費者的市場的成長也將持續(xù)增加。