華文網

穀歌、蘋果、Facebook開撕!誰將成為AR霸主?

幾乎每一個科技巨頭,尤其是蘋果、穀歌和Facebook,都在SLAM技術上有著重金砸入,因為對SLAM技術的應用很大程度上決定了各家在AR領域的優勢程度。

六月初,蘋果走出了進軍AR/VR的第一步——推出了ARKit。

ARKit中很重要的一項技術就是SLAM(Simultaneous Localization And Mapping,即時定位與地圖構建)。幾乎每一個科技巨頭,尤其是蘋果、穀歌和Facebook,都在SLAM技術上有著重金砸入,因為對SLAM技術的應用很大程度上決定了各家在AR領域的優勢程度。

SLAM是電腦視覺技術的一部分,它能夠將物理世界中的視覺資訊以點的形式收集起來,並且讓機器來理解這些資訊。SLAM讓機器獲得了“視覺”,同時通過視覺資訊輸入可以理解自己周圍的環境。

機器通過SLAM技術看到的場景就是下圖展示的這樣。

通過這些資訊點,機器可以理解自己所處的環境。這些資料同時也可以説明AR開發者來創作出更加具有互動性和更加真實的經驗。SLAM可以被應用在許多不同的場景,比如機器人、自動駕駛汽車AI和AR中。

SLAM技術最簡單的一種應用形式就是用來識別牆壁、障礙物和地板。目前大部分AR SLAM技術,比如ARKit,僅僅用到了地板識別和位置追蹤來將AR物體放置在我們的身邊,

因此ARKit實際上並不知道我們的實際環境究竟發生了什麼,也無法做出正確的回應。更加高級的SLAM技術,比如穀歌Tango,可以在我們的環境中創造出一層網來進行更加精確的定位和識別,因此機器不僅能夠告訴你哪裡是地板,同時也能夠識別出環境中的牆壁和物體,將它們變成可以互動的元素。

在SLAM之前的標記點AR

幾年之前,蘋果收購了業內領先的德國AR公司Metaio。

Metaio十分具有創造力,當年在AR市場中擁有很大的分量。我們現在看到的ARKit實際上就是Metaio AR技術的升級版本。沒錯,在蘋果推出ARKit之前,就已經有一些公司在安卓和iOS系統上推出了SLAM技術,比如Wikitude和Kudan。但是蘋果推向市場的東西比普通的SLAM還要更加先進。

在蘋果之前,大部分AR體驗都是基於標記點的,

意味著我們必須要用攝像頭掃描一個是固定的、具體的圖像來生成AR。通過這些圖像,我們的設備可以理解和追蹤疊加在畫面中的數位內容。這種標記點技術的問題在於,用戶必須要有一個實物作為參照來體驗AR,因此廠商必須同時提升軟體和實物(如宣傳冊等)的效果。

ARKit完全解決了這個問題,我們現在用到的僅僅是手機和我們周圍的環境。

但是在ARKit上還有一件很重要的事情仍然缺失:對上下文環境(context)的理解!

僅會識別地板是不夠的

標記點AR技術有局限性,但是它有自己的環境,即可以通過特定的圖像來理解現實世界,並且可以在這個基礎之上改變AR體驗。比如,我們可以將設備上的攝像頭對準麥當勞的某個logo,可以獲得麥當勞的AR體驗;在對準星巴克杯子上的logo時,會獲取完全不同的AR內容。我們所使用的這些智慧設備上的應用叫做AR流覽器,在未來的AR中會是關鍵的角色。

因此,儘管ARKit是一項很棒的技術,但是卻沒有自己的上下文環境,因為ARKit應用並不能夠理解用戶是在哪種場合下使用它。開發者可以使用一些輸入端,像是GPS資料或者環境中的燈光來增加更多的對應環境,但是ARKit的核心部分仍然是缺少環境的。上周有一些開發者用ARKit做出了一些很有趣的導航demo,但是我們必須明白,這些功能的實現依賴於手機本身的GPS資料,而ARKit自己是無法通過攝像頭的輸入來識別位置的。因此ARKit在這一點上和穀歌Tango可以做到的室內導航還差的很遠。

毫無疑問,AR的未來是SLAM技術,但是如何能夠讓AR在生活中更加具有實際的用途,而不僅僅是用來在自家後院裡看SapceX火箭降落,就必須要有對應環境的世界。一些公司,比如穀歌,已經認識到了這一點。

穀歌實際上並不著急

穀歌的SLAM技術集成在Project Tango上,同時公司也在和聯想等合作夥伴一起進行開發。Tango採用了兩個攝像頭,可以檢測到環境的深度,同時可以通過SLAM地圖來理解現實世界。和蘋果的ARKit不同,Tango的核心是有對應環境的,因此可以做到室內導航,因為其比ARKit要高級的多。SLAM地圖是機器對世界的視覺理解的資料庫,其重要性在於,能夠讓機器和物理世界進行交互,同時可以實現機器自我區別兩個不同的地點。

儘管最近看好ARKit前景的報導非常之多,但是穀歌實際上在AR遊戲方面要領先很多。這是因為,歸根結底,對環境的認知是最重要的事。穀歌已經擁有了自己的對應環境,同時可以通過Google Lens來獲取對世界的視覺理解資訊。這部分資料在未來將會更加寶貴,因為人們將會逐漸從移動設備轉向AR眼鏡等可穿戴設備。

Facebook正在努力追趕

實際上,穀歌在AR領域最大的競爭者不是蘋果,而是Facebook。Facebook擁有驚人的20億用戶社群,一旦小紮想出了讓社群掌控地圖定位的方法,就會給Facebook帶來非常大的優勢。和蘋果不同,Facebook的AR佈局全部都內置於自己的應用裡,用戶無法在其他的應用上使用。

有分析師指出,蘋果讓用戶在其他應用裡也能夠使用AR技術是一種比Facebook更加高明的手法。但是長久看來,隨著現實世界視覺地圖的戰爭不斷升級,像Facebook這樣將所有的資訊鎖在自己的地盤裡將會是更大的優勢。

Snap同樣擁有很大的用戶群體,同時也看到了在AR方面的契機。在近日申請的專利中,Snap展示了一種技術,可以將GPS資料和SLAM地圖相結合,將對應的AR內容放置在現實世界中。同時,聯想也和Wikitude聯手打造了一個SLAM資料庫,名為“增強人類雲”。

得資料庫者一統天下

在筆者看來,擁有最完整SLAM資料庫的公司將是最終的贏家。這一資料庫將會讓科技巨頭們的機器可以真正的看懂世界。比如,Facebook可以通過簡單的圖像分析來為你新拍攝的照片打上位置標籤;穀歌可以通過分析你的智慧眼鏡的攝像頭傳回的資訊,來更加精准的投放虛擬廣告;你的自動駕駛汽車可以通過視覺資料來實現自動導航。

話又說回來,儘管科技巨頭們都知道資料庫的重要性,但它們目前在該領域的優劣勢卻不盡相同。

蘋果的在智慧手機市場中的平臺是最為完整的,可以十分輕易地就讓自己的用戶來在手機上體驗到AR。但是蘋果的社群力量並不強大。

Facebook的社區非常強大,但是並沒有一個能夠完全控制其社區的平臺。

谷歌的安卓系統給其平臺帶來很大的力量,同時也有Tango和穀歌Lens這樣的產品。但谷歌缺乏社區的力量,同時Tango也很難在近期的市場獲得大的進展,因為其需要特定的硬體,但合作夥伴並不是太多。

AR被預測會成長會數十億美元的市場,而對現實世界的視覺理解在接下來幾年內都將是科技巨頭們的必爭之地。像蘋果這樣在地圖上有所缺失的公司應該更加謹慎了。

在未來的AR中會是關鍵的角色。

因此,儘管ARKit是一項很棒的技術,但是卻沒有自己的上下文環境,因為ARKit應用並不能夠理解用戶是在哪種場合下使用它。開發者可以使用一些輸入端,像是GPS資料或者環境中的燈光來增加更多的對應環境,但是ARKit的核心部分仍然是缺少環境的。上周有一些開發者用ARKit做出了一些很有趣的導航demo,但是我們必須明白,這些功能的實現依賴於手機本身的GPS資料,而ARKit自己是無法通過攝像頭的輸入來識別位置的。因此ARKit在這一點上和穀歌Tango可以做到的室內導航還差的很遠。

毫無疑問,AR的未來是SLAM技術,但是如何能夠讓AR在生活中更加具有實際的用途,而不僅僅是用來在自家後院裡看SapceX火箭降落,就必須要有對應環境的世界。一些公司,比如穀歌,已經認識到了這一點。

穀歌實際上並不著急

穀歌的SLAM技術集成在Project Tango上,同時公司也在和聯想等合作夥伴一起進行開發。Tango採用了兩個攝像頭,可以檢測到環境的深度,同時可以通過SLAM地圖來理解現實世界。和蘋果的ARKit不同,Tango的核心是有對應環境的,因此可以做到室內導航,因為其比ARKit要高級的多。SLAM地圖是機器對世界的視覺理解的資料庫,其重要性在於,能夠讓機器和物理世界進行交互,同時可以實現機器自我區別兩個不同的地點。

儘管最近看好ARKit前景的報導非常之多,但是穀歌實際上在AR遊戲方面要領先很多。這是因為,歸根結底,對環境的認知是最重要的事。穀歌已經擁有了自己的對應環境,同時可以通過Google Lens來獲取對世界的視覺理解資訊。這部分資料在未來將會更加寶貴,因為人們將會逐漸從移動設備轉向AR眼鏡等可穿戴設備。

Facebook正在努力追趕

實際上,穀歌在AR領域最大的競爭者不是蘋果,而是Facebook。Facebook擁有驚人的20億用戶社群,一旦小紮想出了讓社群掌控地圖定位的方法,就會給Facebook帶來非常大的優勢。和蘋果不同,Facebook的AR佈局全部都內置於自己的應用裡,用戶無法在其他的應用上使用。

有分析師指出,蘋果讓用戶在其他應用裡也能夠使用AR技術是一種比Facebook更加高明的手法。但是長久看來,隨著現實世界視覺地圖的戰爭不斷升級,像Facebook這樣將所有的資訊鎖在自己的地盤裡將會是更大的優勢。

Snap同樣擁有很大的用戶群體,同時也看到了在AR方面的契機。在近日申請的專利中,Snap展示了一種技術,可以將GPS資料和SLAM地圖相結合,將對應的AR內容放置在現實世界中。同時,聯想也和Wikitude聯手打造了一個SLAM資料庫,名為“增強人類雲”。

得資料庫者一統天下

在筆者看來,擁有最完整SLAM資料庫的公司將是最終的贏家。這一資料庫將會讓科技巨頭們的機器可以真正的看懂世界。比如,Facebook可以通過簡單的圖像分析來為你新拍攝的照片打上位置標籤;穀歌可以通過分析你的智慧眼鏡的攝像頭傳回的資訊,來更加精准的投放虛擬廣告;你的自動駕駛汽車可以通過視覺資料來實現自動導航。

話又說回來,儘管科技巨頭們都知道資料庫的重要性,但它們目前在該領域的優劣勢卻不盡相同。

蘋果的在智慧手機市場中的平臺是最為完整的,可以十分輕易地就讓自己的用戶來在手機上體驗到AR。但是蘋果的社群力量並不強大。

Facebook的社區非常強大,但是並沒有一個能夠完全控制其社區的平臺。

谷歌的安卓系統給其平臺帶來很大的力量,同時也有Tango和穀歌Lens這樣的產品。但谷歌缺乏社區的力量,同時Tango也很難在近期的市場獲得大的進展,因為其需要特定的硬體,但合作夥伴並不是太多。

AR被預測會成長會數十億美元的市場,而對現實世界的視覺理解在接下來幾年內都將是科技巨頭們的必爭之地。像蘋果這樣在地圖上有所缺失的公司應該更加謹慎了。