華文網

別BB了,你們看到的是假Magic Leap吧?

人們一直鍾情於的虛擬實境、人工智慧究竟是什麼?

那些頭戴各種設備,一邊挪動豐滿的身軀,一邊口吐各種驚歎詞的人究竟是些什麼人?

今天,我們推出一篇文章,說的是MR(混合現實)。

本文4649字,看完需要5分鐘,完全看懂可能需要1小時-5天不等,出於公德心,我們先來幾條核心提示:

1、VR(虛擬實境)、AR(增強現實)殊途同歸,未來只有MR(混合現實)。

2、PC、手機之後,以語音交互為核心的HMD(頭戴式顯示器)將是下一代計算平臺。

3、微軟的頭戴顯示器Hololens是MR行業的標杆。

4、被斥為騙子,靠“特效視頻”融資的Magic Leap其實另一個MR核心選手。

5、二者共同定義了MR的3個核心能力:空間視覺、鏡片背後的光學系統、硬體及架構思路。

6、前兩名甩開了其他對手,但技術邊界並沒有看上去那麼牢固。意識到核心能力是什麼,不難趕上。

7、最後,這也是MR投資和創業領域的路線圖。

讓我們先從那個著名的“鯨魚從體育館甲板一躍而起”視頻開始吧。

Magic Leap——MR市場中唯二的玩家

某種程度上,

整個AR行業都因為這個炫酷的視頻而帶上光環。

所以,當人們知道這並不是真的來自AR技術,而是源於好萊塢式的特效,視頻的”出品方”Magic Leap備受爭議。它著名的中國投資者馬雲也因此受到一些奚落。

2月份,Magic Leap2017年董事會召開,並且公佈了一個“簡陋”的樣機照片後,塵埃落定了,野心家與陰謀論者中混雜著各種各樣“死道友不死貧道”的心情,簡單的把Magic Leap釘在了恥辱柱上。一言以蔽之:“盛名之下,

其實難副”。

無可否認,Magic Leap真真假假的宣傳策略客觀上拉高了吃瓜群眾對它的預期,把自己架上神壇之後與其告訴大家“雖然我很好但是也沒有你想的那麼牛”,不如乾脆保持沉默悶聲發財。

但必須要說,微軟(Hololens)以及Magic Leap是我看來MR市場中唯二的玩家,雖然可能二者目前來看微軟領先,

但如果我們將MR看做下一代計算平臺的核心概念,怎麼吹Magic Leap都不過分,畢竟他是一個“挑戰巨頭的初創公司”。

至於Meta、ODG、Lumus、Infinity AR等等等等的公司,在我看來至少目前他們在核心能力上還都有欠缺,暫且按下不提。

首先,Magic Leap到底在幹啥?

先上兩張圖:

上圖是Magic Leap第一批被扒出來的專利圖之一,清晰地展示了其HMD(頭戴顯示器)的設計思路:為了減輕重量,把計算單元和電池都外置,眼鏡上只留下必要的感測器以加強佩戴舒適度。

而下圖是剛剛流出的Magic Leap原型機“諜照”,也是印證了之前專利圖中的設計思路,所有的計算單元包括電源都是外置的,頭上的眼鏡只是做輸入輸出設備。

雖然巨大的開發板簡直無法直視,不過我們仍然能從開發板中獲得一些資訊(以下資訊有推測部分,不保證完全正確):

首先,從散熱器看,和NVIDIA JETSON TX1的散熱器一模一樣,以及沒有在圖片中找到其他處理器,大概率是用的Nvidia Tegra平臺。

Jetson TX1 開發板官方圖

其次,假設使用的是TX1,TX1是Nvidia針對機器學習推出的嵌入式系統平臺,處理器性能提升並不明顯,側面反映了Magic Leap設備目前通用計算的量不大,而含256個CUDA核心的GPU肯定是為了MR設備的高圖形運算需求而生的,但是帶來了另外的發熱以及功耗方面的困擾:

巨大的風扇和開發板直接用AC電源輸出,這塊峰值功率達到10W的開發板,不知未來小型化的前景如何,雖然一個“外置式”的計算模組對重量要求可能會降低,但是“板磚”估計也不能被接受的。

技術總是在不斷衍進的。剛剛發佈的Nitendo Switch就搭載了Nvidia最新一代的Tegra Parker處理器。不排除Magic Leap已經跳過了TX1直接上Parker平臺,畢竟TX1硬傷太明顯,Nvidia並沒有在這一代平臺上發力,有可能集中精力在做下一代Parker平臺。

附上Parker與TX1、TK1 Spec對比

看上去是幹活的,但是究竟幹得怎麼樣?

首先,這裡要明確一個觀點:技術的邊界是趨同的(特別是做軟體、演算法層面的公司)。在對真正前沿科技的探索上,同領域的頂級公司技術差距其實並不大(因為大家用的技術框架其實都很類似)。

舉個例子, 在圖像識別領域,每年ImageNet的比賽頂級team之間的差距並不大(標準實驗室環境下),每年的冠軍也是輪流換,真正有巨大提升的,是Hinton12年用深度學習來做圖像識別那一年,之後大家都換成了深度學習框架,競爭又變成了一個兩個百分點的競爭。

當然如果變成了複雜環境或者說真實環境,大家的技術體驗就更相似了:40%正確率和60%正確率,對於用戶來說都是一樣的:不准!

另外一個例子就是VR行業:Oculus相對VIVE,起步早一些,但是實際能拿出的產品從體驗上來看區別不大,甚至PS VR雖然技術指標不如前兩者,實際上卻是出貨量最大也最受好評的VR平臺。

所以,如果我們把Hololens所定義的MR當做這個行業目前的標杆,躋身行業一線玩家行列,需要具備什麼樣的條件呢?

首先是空間視覺能力,或者說是基於嵌入式平臺的SLAM(即時定位與地圖構建,或併發建圖與定位)。Hololens之所以帶來這麼大的震撼,主要也是因為這是第一個公開銷售並集成了Inside-out追蹤技術的HMD系統(什麼是Inside-out空間定位技術,簡單來說就是利用設備自身,而不依靠外部的感測器等配件,實現虛擬場景裡的空間定位,以及更多的人機交互)。

在這之前,所有HMD搭載的定位系統都是outside-in方案,即需要外置的攝像頭拍攝頭盔或者控制器的mark點來定位。從使用難度來講相去不可以道裡計(用過VIVE的都懂)。

Inside-out技術簡示

其次,光有Inside-out本身是不足以支撐混合現實體驗的,還需要空間資訊或者說深度資訊的疊加,才能夠真正實現定位+空間重建來支撐完整的混合現實體驗。深度資訊與SLAM的疊加從技術難度上來說並不高,但是目前鑒於大家連inside-out還沒做好,空間資訊的疊加還需等待。

SLAM本身並不是一個新東西,國內也有相當多的團隊在做,比較突出的包括速感科技,Perceptin等等,但是目前都還是作為一個雙目空間攝像頭模組存在,Ximmerse拿出了自己的inside-out方案,也是取了個巧,利用攝像頭拍攝手柄上的光點進行定位,還不能算是廣義上的inside-out方案。

國外目前在做空間視覺的創業公司包括Infinity AR,Occitipal等等,今年CES2017幾家公司也均有參展,Infinity AR的Demo是一個飛機在桌子上起落飛翔的動態演示,但是跑道與桌子的貼合包括整體影像的晃動都很劇烈,演示效果離Hololens的穩定狀態還有比較大的差距。

相比之下Occitpal的演示則更令人印象深刻,整體體驗非常好,但我個人懷疑是針對特定的演示場景做了優化,實際產品能達到什麼樣的效果尚數未知。

大公司方面,Oculus去年宣佈了自己的一體機Santa Cruz,承諾會有inside-out定位功能,Google Tango一直是移動SLAM的先行者,蘋果也收購了相當多AR相關的公司,據傳也在研究眼鏡產品,高通也已經發佈了自己的VR一體機產品,號稱有inside-out追蹤功能,其他公司包括ODG,Lumus,Meta等等,目前還都是在提供基於不同光學方案的AR眼鏡產品,由於不具有空間視覺功能,尚不能認定為MR產品。

第二點,就是要有好的AR光學方案,Hololens包括Magic Leap都是採用了全息波導衍射光柵的光學鏡片,而其他公司如ODG及Meta等則採用自由曲面、棱鏡或者幾者混合的光學方案。

顯示技術應當說在目前來看,技術反覆運算的路線整體是向光波導光學靠攏的,只有光波導才能做到真正像現在正常眼鏡一樣大小輕重的HMD產品。

但是目前光波導鏡片面臨量產難度大,成本高,FOV(field of view, 簡單來說,就是玩家遊戲時的視野)不足的問題,相對來說自由曲面或者棱鏡的光學方案則門檻更低,相對供應鏈更成熟,顯示效果跟目前成熟的光波導鏡片來看也完全不差甚至猶有過之。

Meta用很笨拙的方案就做到了90度FOV,而今年CES Lumus展出的50度光波導鏡片方案已經是目前最領先的光波導鏡片了,更不要說他巨大的頭部器件和發熱。

本人實測Lumus

第三點,就是一些硬體包括其背後體現的思路,具體應當說包含三點:四攝像頭SLAM,結構光以及HPU。

首先是四攝像頭,感興趣的同學大概已經發現了一個奇怪的巧合:Oculus的一體機Santa Cruz也是採用了四攝像頭方案(不過Hololens的方案是左右各兩個,Santa Cruz的方案是上下各兩個)。

我猜Magic Leap也會採用四攝像頭的方案,主要是為了在保證mapping的angular resolution的基礎上,同時兼顧tracking的FOV,說白了,就是為了看得更准更寬,從而保證了定位和追蹤的穩定性,這是雙目甚至單目解決不了的。

結構光:Hololens的深度資訊均來自結構光攝像頭,包括手勢識別,但這裡一個有意思的事情是,很多人做SLAM的時候也會結合結構光資訊來做,但這在HMD上是無法應用的,因為結構光在做空間識別的時候,識別範圍較遠,是不能夠識別近距離的手的具體資訊的,所以如果使用了結構光來做SLAM,實際上是無法同時應用手勢識別的。

在Hololens具體操作時,也是預先掃描了周邊環境的深度資訊,然後才開始做手勢識別交互。

HPU是另一個被傳得神乎其神的東西,實際上是微軟定制的Cadence Tensilica的DSP,內含24個核心,主要用來處理跟視覺,手勢,環境感知相關的一切演算法。

所以算力提升對於MR行業來說仍然是亟需解決的問題,想想Magic Leap開發板上巨大的散熱器~

所以總結來看,目前除了微軟,行業內的其他玩家都或多或少的缺乏MR產品的一部分核心能力,而Magic Leap,無論從其展示的思路還是靠譜的小道消息,是最靠近這個技術路線並且已經有相當技術積累的公司。

所以,那些神視頻到底怎麼回事?

首先,Magic Leap總共發佈過4段視頻(辦公室機器人大戰、太陽系、A new morning以及星戰)+2個動圖Demo(鯨魚以及手心小象)。

其中辦公室機器人大戰、鯨魚以及手心小象都是特效視頻,其餘的均為“Shot directly from Magic Leap”。所以之前很多媒體報導中所謂“均為特效”是不實的,不過實拍的內容中細琢磨的話也有很多小tricks,下面詳細分析一下:

1. 兩張截圖分別來自兩段視頻,但都非常清晰的顯示了一個問題:桌子可以非常完美的把R2D2的身體擋住,當機器人走到桌子旁邊或者鏡頭位置變化到有物體在前面“遮擋”圖像的時候,被遮擋的圖像就完美的不顯示了!這是怎麼做到的呢?

我們知道眼鏡類的產品,鏡片是所有光線進入眼睛的最後一道門戶,理論上鏡片上的圖像是疊加在所有外在資訊之上的,這種“被遮擋”的錯覺顯然是因為眼鏡根據深度資訊發現圖像產生了“被遮擋”的關係,從而停止渲染那部分區域的圖像,讓自然光線透過鏡片,實現了類似“被遮擋”的效果。

道理都說得通,問題是這裡的被遮擋關係展現的太完美了,不僅圖像穩定清晰,被遮擋的邊緣也沒有絲毫誤差,這就很有意思了。可以對比一下Hololens在使用環境下,雖然也能做到部分的“被遮擋”效果,但是會產生很頻繁的畫面抖動,因為並不確定被遮擋的邊緣以及面積到底有多少。

竊以為Magic Leap在這些演示視頻中,雖然確實是即時渲染而且是實拍的,但是肯定對場景做了預先的精細掃描和建模,才能夠達到這麼好的效果。

這也是平時在看SLAM專案的時候的一大問題:演示視頻或者場景由於有事先特定的優化,能夠實現比真實使用中好得多的效果,有的時候限於時間因素不能反復測試,經常會被這樣的“小把戲”欺騙,等真的詳細DD的時候,又發現了這樣那樣技術上難以克服的問題。

2. 關於太陽系的這一段視頻也是非常有趣的,展現了Magic Leap的“光場顯示”技術,即在不同的景深上可以成像。演示視頻中一會兒太陽很清晰,一會兒地球很清晰,是很明顯的光場顯示技術的應用。

這裡又有一個很有趣的問題了,不是說好了用光波導的嗎?光場技術到底是什麼情況?實際上Magic Leap確實是有很深的光場顯示包括光纖顯示技術的儲備,但是由於種種問題,離真正產品化路還非常遠,應該說這段視頻只是秀肌肉,短時間之內是不可能看到類似的產品面世的。

光場顯示其實國內有團隊在做,我也在中科院某所看過類似的Demo,整個光學系統就比目前的頭盔還大,還只能實現7個焦距上的光場顯示,完全不具備產品化價值(Magic Leap據說要好很多)。

而光纖顯示,大家從光纖的屬性上其實也能推測到,這麼脆弱的介質,稍微用一用就會有變形,錯位等等的問題,產品化的路也很漫長。

3. 關於其他的演示視頻

其實除了鯨魚那段演示視頻確實是太浮誇了之外(其實你想像所有人都戴著眼鏡但是P掉了就好),其餘無論小象的demo還是機器人大戰的demo,都是在目前的技術環境下可以實現的,大家完全不必對技術這麼悲觀,這段算勉強洗個地。

最後,最重要的是MR(混合現實)的未來

之所以說了這麼久Magic Leap的故事,是因為MR讓我振奮。以下簡單說說我的觀點:

1. VR、AR殊途同歸,未來只有MR。

設想一下,VR一體機和AR眼鏡,最主要的區別是什麼呢?其實就是一個是透明的,一個是不透明的。

目前來看VR擁有更大視角以及不透明的視野,而AR眼鏡視角小,但是能看到現實世界。無論VR還是AR的創業者,都很明白空間視覺的重要性,因為它本質上就是用戶體驗,更大的視角,更透明的世界,他們都想要。

另一方面來說,眼球追蹤,手勢識別,全景音效以及更好的人體工學也都是所有從業者共同追求的,未來會成為所有HMD產品的標配。而大視角、高解析度也會是所有產品的一個共同追求。

這樣看來,透明或者不透明,其實就不是問題了,只要多做一個遮罩,甚至是鏡片上附一層可調透光度的膜,就可以解決這個問題。目前所有VR/AR從業者所努力的方向可以說是統一的,那就是VR與 AR合二為一。

2. 從實際技術演進來看,MR設備更容易成熟。

2016-2017年,VR行業在國內可以說從天堂到地獄,從16年初的萬人空巷到17年初的慘慘戚戚,客觀上反映了VR設備在普及上遇到的問題,其中最最主要的問題就是眩暈感遲遲無法解決,用戶的平均使用時間基本上在15分鐘左右,根本無法支撐真正優質內容的產生,從而導致了惡性循環。

在我看來,眩暈感或許是5年內VR設備無法邁過的門檻,除非用類似萬向跑步機的外設,否則簡單的“房間級”追蹤,還是無法完美解決用戶的暈動症問題。藥物可能是解決這個問題的最佳方案。而MR設備則不同,能看到外面的場景包括相對小很多的FOV,都會讓使用者在實際使用中更容易接受。

3. PC、手機之後,下一代計算平臺將會是以語音交互為核心的HMD產品。

如果你留心看CES2017,一個很大的改變就是AR作為一個單獨的品類開始參展,ODG,Lumus,Vuzix,Sony,Infinity AR,Occitipal等等,成為了CES 2017少有的亮點。今年VR參展的數量很少,不過用VR進行展示的企業很多,VR已經變成一個Feature。

無論是Oculus開始招募AR團隊,還是蘋果要發佈自己的AR產品,華為招募了前Oculus大牛做AR/VR/MR技術負責人等等,都清晰的說明了一個資訊:巨頭正在跑步入場。

正如之前所提過的,技術的邊界是趨同的,當巨頭們看到Hololens這樣的產品是可實現的之後,相關的創新包括探索也會層出不窮,相關的技術人才、技術儲備也會導致整個市場的百花齊放,我們正處在快速反覆運算的時代,科技水準的發展真的要用“日新月異”來形容。

以語音交互為核心的HMD作為下一代計算平臺出現在尋常百姓家的日子,已經越來越近了。

所有的計算單元包括電源都是外置的,頭上的眼鏡只是做輸入輸出設備。

雖然巨大的開發板簡直無法直視,不過我們仍然能從開發板中獲得一些資訊(以下資訊有推測部分,不保證完全正確):

首先,從散熱器看,和NVIDIA JETSON TX1的散熱器一模一樣,以及沒有在圖片中找到其他處理器,大概率是用的Nvidia Tegra平臺。

Jetson TX1 開發板官方圖

其次,假設使用的是TX1,TX1是Nvidia針對機器學習推出的嵌入式系統平臺,處理器性能提升並不明顯,側面反映了Magic Leap設備目前通用計算的量不大,而含256個CUDA核心的GPU肯定是為了MR設備的高圖形運算需求而生的,但是帶來了另外的發熱以及功耗方面的困擾:

巨大的風扇和開發板直接用AC電源輸出,這塊峰值功率達到10W的開發板,不知未來小型化的前景如何,雖然一個“外置式”的計算模組對重量要求可能會降低,但是“板磚”估計也不能被接受的。

技術總是在不斷衍進的。剛剛發佈的Nitendo Switch就搭載了Nvidia最新一代的Tegra Parker處理器。不排除Magic Leap已經跳過了TX1直接上Parker平臺,畢竟TX1硬傷太明顯,Nvidia並沒有在這一代平臺上發力,有可能集中精力在做下一代Parker平臺。

附上Parker與TX1、TK1 Spec對比

看上去是幹活的,但是究竟幹得怎麼樣?

首先,這裡要明確一個觀點:技術的邊界是趨同的(特別是做軟體、演算法層面的公司)。在對真正前沿科技的探索上,同領域的頂級公司技術差距其實並不大(因為大家用的技術框架其實都很類似)。

舉個例子, 在圖像識別領域,每年ImageNet的比賽頂級team之間的差距並不大(標準實驗室環境下),每年的冠軍也是輪流換,真正有巨大提升的,是Hinton12年用深度學習來做圖像識別那一年,之後大家都換成了深度學習框架,競爭又變成了一個兩個百分點的競爭。

當然如果變成了複雜環境或者說真實環境,大家的技術體驗就更相似了:40%正確率和60%正確率,對於用戶來說都是一樣的:不准!

另外一個例子就是VR行業:Oculus相對VIVE,起步早一些,但是實際能拿出的產品從體驗上來看區別不大,甚至PS VR雖然技術指標不如前兩者,實際上卻是出貨量最大也最受好評的VR平臺。

所以,如果我們把Hololens所定義的MR當做這個行業目前的標杆,躋身行業一線玩家行列,需要具備什麼樣的條件呢?

首先是空間視覺能力,或者說是基於嵌入式平臺的SLAM(即時定位與地圖構建,或併發建圖與定位)。Hololens之所以帶來這麼大的震撼,主要也是因為這是第一個公開銷售並集成了Inside-out追蹤技術的HMD系統(什麼是Inside-out空間定位技術,簡單來說就是利用設備自身,而不依靠外部的感測器等配件,實現虛擬場景裡的空間定位,以及更多的人機交互)。

在這之前,所有HMD搭載的定位系統都是outside-in方案,即需要外置的攝像頭拍攝頭盔或者控制器的mark點來定位。從使用難度來講相去不可以道裡計(用過VIVE的都懂)。

Inside-out技術簡示

其次,光有Inside-out本身是不足以支撐混合現實體驗的,還需要空間資訊或者說深度資訊的疊加,才能夠真正實現定位+空間重建來支撐完整的混合現實體驗。深度資訊與SLAM的疊加從技術難度上來說並不高,但是目前鑒於大家連inside-out還沒做好,空間資訊的疊加還需等待。

SLAM本身並不是一個新東西,國內也有相當多的團隊在做,比較突出的包括速感科技,Perceptin等等,但是目前都還是作為一個雙目空間攝像頭模組存在,Ximmerse拿出了自己的inside-out方案,也是取了個巧,利用攝像頭拍攝手柄上的光點進行定位,還不能算是廣義上的inside-out方案。

國外目前在做空間視覺的創業公司包括Infinity AR,Occitipal等等,今年CES2017幾家公司也均有參展,Infinity AR的Demo是一個飛機在桌子上起落飛翔的動態演示,但是跑道與桌子的貼合包括整體影像的晃動都很劇烈,演示效果離Hololens的穩定狀態還有比較大的差距。

相比之下Occitpal的演示則更令人印象深刻,整體體驗非常好,但我個人懷疑是針對特定的演示場景做了優化,實際產品能達到什麼樣的效果尚數未知。

大公司方面,Oculus去年宣佈了自己的一體機Santa Cruz,承諾會有inside-out定位功能,Google Tango一直是移動SLAM的先行者,蘋果也收購了相當多AR相關的公司,據傳也在研究眼鏡產品,高通也已經發佈了自己的VR一體機產品,號稱有inside-out追蹤功能,其他公司包括ODG,Lumus,Meta等等,目前還都是在提供基於不同光學方案的AR眼鏡產品,由於不具有空間視覺功能,尚不能認定為MR產品。

第二點,就是要有好的AR光學方案,Hololens包括Magic Leap都是採用了全息波導衍射光柵的光學鏡片,而其他公司如ODG及Meta等則採用自由曲面、棱鏡或者幾者混合的光學方案。

顯示技術應當說在目前來看,技術反覆運算的路線整體是向光波導光學靠攏的,只有光波導才能做到真正像現在正常眼鏡一樣大小輕重的HMD產品。

但是目前光波導鏡片面臨量產難度大,成本高,FOV(field of view, 簡單來說,就是玩家遊戲時的視野)不足的問題,相對來說自由曲面或者棱鏡的光學方案則門檻更低,相對供應鏈更成熟,顯示效果跟目前成熟的光波導鏡片來看也完全不差甚至猶有過之。

Meta用很笨拙的方案就做到了90度FOV,而今年CES Lumus展出的50度光波導鏡片方案已經是目前最領先的光波導鏡片了,更不要說他巨大的頭部器件和發熱。

本人實測Lumus

第三點,就是一些硬體包括其背後體現的思路,具體應當說包含三點:四攝像頭SLAM,結構光以及HPU。

首先是四攝像頭,感興趣的同學大概已經發現了一個奇怪的巧合:Oculus的一體機Santa Cruz也是採用了四攝像頭方案(不過Hololens的方案是左右各兩個,Santa Cruz的方案是上下各兩個)。

我猜Magic Leap也會採用四攝像頭的方案,主要是為了在保證mapping的angular resolution的基礎上,同時兼顧tracking的FOV,說白了,就是為了看得更准更寬,從而保證了定位和追蹤的穩定性,這是雙目甚至單目解決不了的。

結構光:Hololens的深度資訊均來自結構光攝像頭,包括手勢識別,但這裡一個有意思的事情是,很多人做SLAM的時候也會結合結構光資訊來做,但這在HMD上是無法應用的,因為結構光在做空間識別的時候,識別範圍較遠,是不能夠識別近距離的手的具體資訊的,所以如果使用了結構光來做SLAM,實際上是無法同時應用手勢識別的。

在Hololens具體操作時,也是預先掃描了周邊環境的深度資訊,然後才開始做手勢識別交互。

HPU是另一個被傳得神乎其神的東西,實際上是微軟定制的Cadence Tensilica的DSP,內含24個核心,主要用來處理跟視覺,手勢,環境感知相關的一切演算法。

所以算力提升對於MR行業來說仍然是亟需解決的問題,想想Magic Leap開發板上巨大的散熱器~

所以總結來看,目前除了微軟,行業內的其他玩家都或多或少的缺乏MR產品的一部分核心能力,而Magic Leap,無論從其展示的思路還是靠譜的小道消息,是最靠近這個技術路線並且已經有相當技術積累的公司。

所以,那些神視頻到底怎麼回事?

首先,Magic Leap總共發佈過4段視頻(辦公室機器人大戰、太陽系、A new morning以及星戰)+2個動圖Demo(鯨魚以及手心小象)。

其中辦公室機器人大戰、鯨魚以及手心小象都是特效視頻,其餘的均為“Shot directly from Magic Leap”。所以之前很多媒體報導中所謂“均為特效”是不實的,不過實拍的內容中細琢磨的話也有很多小tricks,下面詳細分析一下:

1. 兩張截圖分別來自兩段視頻,但都非常清晰的顯示了一個問題:桌子可以非常完美的把R2D2的身體擋住,當機器人走到桌子旁邊或者鏡頭位置變化到有物體在前面“遮擋”圖像的時候,被遮擋的圖像就完美的不顯示了!這是怎麼做到的呢?

我們知道眼鏡類的產品,鏡片是所有光線進入眼睛的最後一道門戶,理論上鏡片上的圖像是疊加在所有外在資訊之上的,這種“被遮擋”的錯覺顯然是因為眼鏡根據深度資訊發現圖像產生了“被遮擋”的關係,從而停止渲染那部分區域的圖像,讓自然光線透過鏡片,實現了類似“被遮擋”的效果。

道理都說得通,問題是這裡的被遮擋關係展現的太完美了,不僅圖像穩定清晰,被遮擋的邊緣也沒有絲毫誤差,這就很有意思了。可以對比一下Hololens在使用環境下,雖然也能做到部分的“被遮擋”效果,但是會產生很頻繁的畫面抖動,因為並不確定被遮擋的邊緣以及面積到底有多少。

竊以為Magic Leap在這些演示視頻中,雖然確實是即時渲染而且是實拍的,但是肯定對場景做了預先的精細掃描和建模,才能夠達到這麼好的效果。

這也是平時在看SLAM專案的時候的一大問題:演示視頻或者場景由於有事先特定的優化,能夠實現比真實使用中好得多的效果,有的時候限於時間因素不能反復測試,經常會被這樣的“小把戲”欺騙,等真的詳細DD的時候,又發現了這樣那樣技術上難以克服的問題。

2. 關於太陽系的這一段視頻也是非常有趣的,展現了Magic Leap的“光場顯示”技術,即在不同的景深上可以成像。演示視頻中一會兒太陽很清晰,一會兒地球很清晰,是很明顯的光場顯示技術的應用。

這裡又有一個很有趣的問題了,不是說好了用光波導的嗎?光場技術到底是什麼情況?實際上Magic Leap確實是有很深的光場顯示包括光纖顯示技術的儲備,但是由於種種問題,離真正產品化路還非常遠,應該說這段視頻只是秀肌肉,短時間之內是不可能看到類似的產品面世的。

光場顯示其實國內有團隊在做,我也在中科院某所看過類似的Demo,整個光學系統就比目前的頭盔還大,還只能實現7個焦距上的光場顯示,完全不具備產品化價值(Magic Leap據說要好很多)。

而光纖顯示,大家從光纖的屬性上其實也能推測到,這麼脆弱的介質,稍微用一用就會有變形,錯位等等的問題,產品化的路也很漫長。

3. 關於其他的演示視頻

其實除了鯨魚那段演示視頻確實是太浮誇了之外(其實你想像所有人都戴著眼鏡但是P掉了就好),其餘無論小象的demo還是機器人大戰的demo,都是在目前的技術環境下可以實現的,大家完全不必對技術這麼悲觀,這段算勉強洗個地。

最後,最重要的是MR(混合現實)的未來

之所以說了這麼久Magic Leap的故事,是因為MR讓我振奮。以下簡單說說我的觀點:

1. VR、AR殊途同歸,未來只有MR。

設想一下,VR一體機和AR眼鏡,最主要的區別是什麼呢?其實就是一個是透明的,一個是不透明的。

目前來看VR擁有更大視角以及不透明的視野,而AR眼鏡視角小,但是能看到現實世界。無論VR還是AR的創業者,都很明白空間視覺的重要性,因為它本質上就是用戶體驗,更大的視角,更透明的世界,他們都想要。

另一方面來說,眼球追蹤,手勢識別,全景音效以及更好的人體工學也都是所有從業者共同追求的,未來會成為所有HMD產品的標配。而大視角、高解析度也會是所有產品的一個共同追求。

這樣看來,透明或者不透明,其實就不是問題了,只要多做一個遮罩,甚至是鏡片上附一層可調透光度的膜,就可以解決這個問題。目前所有VR/AR從業者所努力的方向可以說是統一的,那就是VR與 AR合二為一。

2. 從實際技術演進來看,MR設備更容易成熟。

2016-2017年,VR行業在國內可以說從天堂到地獄,從16年初的萬人空巷到17年初的慘慘戚戚,客觀上反映了VR設備在普及上遇到的問題,其中最最主要的問題就是眩暈感遲遲無法解決,用戶的平均使用時間基本上在15分鐘左右,根本無法支撐真正優質內容的產生,從而導致了惡性循環。

在我看來,眩暈感或許是5年內VR設備無法邁過的門檻,除非用類似萬向跑步機的外設,否則簡單的“房間級”追蹤,還是無法完美解決用戶的暈動症問題。藥物可能是解決這個問題的最佳方案。而MR設備則不同,能看到外面的場景包括相對小很多的FOV,都會讓使用者在實際使用中更容易接受。

3. PC、手機之後,下一代計算平臺將會是以語音交互為核心的HMD產品。

如果你留心看CES2017,一個很大的改變就是AR作為一個單獨的品類開始參展,ODG,Lumus,Vuzix,Sony,Infinity AR,Occitipal等等,成為了CES 2017少有的亮點。今年VR參展的數量很少,不過用VR進行展示的企業很多,VR已經變成一個Feature。

無論是Oculus開始招募AR團隊,還是蘋果要發佈自己的AR產品,華為招募了前Oculus大牛做AR/VR/MR技術負責人等等,都清晰的說明了一個資訊:巨頭正在跑步入場。

正如之前所提過的,技術的邊界是趨同的,當巨頭們看到Hololens這樣的產品是可實現的之後,相關的創新包括探索也會層出不窮,相關的技術人才、技術儲備也會導致整個市場的百花齊放,我們正處在快速反覆運算的時代,科技水準的發展真的要用“日新月異”來形容。

以語音交互為核心的HMD作為下一代計算平臺出現在尋常百姓家的日子,已經越來越近了。